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(54) TiUe: NON-M NON-O HIV STRAINS, FRAGMENTS AND AWUCATIONS 
(54) Titre: SOUCHES DE VIH-1 NON-^ NON-O, FRAGMENTS ET APPUCATIONS 
(57) Abstract 

The invention concerns retroviral strains of the group HTV-l, noiv-M 
noiv-O, particularly a strain called YBF30, its fragments and its applications as 
diagnosis reagent and as immunogenic agent. The HIV-2 different bodi from 
the group M and from the group O have die following characteristics: little or 
no serological response widi respect to proteins of groups M and O and strong 
serological response widi respect to proteins derived from die YBF30 strain or 
the Srv CPZGAB strain; absence of genomic amplification by the primers of 
regions env and gag of the HIV-1-1 of groups M and O; genomic amplification 
in the presence of die primers derived from the YBF30 strain; and homology 
of the envelope gene products higher than 70 % widi respect to the YBF30 
strain. 

(57) Abr^^ 

Souches de retrovirus du groupe VIH-1, non-M non-O, notamment 
une souche d6nomm6e YBF30. ses fragments ainsi que ses applications, en 
tant que rdactif de diagnostic ct en tant qu'agent immunogfcne. Les VIH-1 
distincts k la fois du groupe M et du groupe O pr6sentent les caract^nstiques 
suivantes: peu ou pas de r6actiyit6 sdrologique vi»-^vis des prot6ines des 
groupes M et O et forte r6activit6 s6rolQgique vis-ll-vis des prot6ines issues 
de la souche YBF30 selon Tinvention ou de la souche SIV CPZGAB; absence 
d'amplification g6nomique k I'aide des amorces des r6gions env et gag des 
VIH-1 des groupes M et O; amplification g6nomique en prdsenoe des amorces issues de la souche YBF30, selon I'tnvention; et homologie 
des produits du g6ne d'enveloppe sup6rieure ft 70 % vis-^vis de la souche YBF30. 
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SOUCHES DE VIH-1 NON-M NON-O, FRAGMENTS ET APPLICATIONS. 

La presente invention est relative a des souches de retrovirus du 
groupe VIH-1, non-M non-0, notamment une souche denommee YBF30, a ses frag- 
ments ainsi qu'a ses applications, en tant que reactif de diagnostic et en tant qu'agent 
3 immunogene. 

Les virus humains de I'immunodeficience acquise, VIH-1 et VIH-2 
sont des retrolenti^arus, virus retrouves chez de nombreux primates africains. Tous ces 
virus semblent avoir un ancetre commun ; il est toutefois tres difficile de prejuger de la 
periode k laquelle ces difFerents virus se sont separes de ce precurseur. D'autres virus 
10 plus distants bien que faisant partie du meme groupe sont retrouves chez d'autres 
manmiiferes (ongules et felins). 

Tous ces virus sont associes a des infections longues ; Tabsence de 
symptSmes est la regie chez les singes infectes naturellement. 

Du fait de sa forte homologie avec le virus du Sooty Mangabey 
15 (Afirique de TOuest), I'origine du VIH-2 semble ciaire, mais aucun virus proche du 
VIH-1 n'a ete retrouve chez les singes. Les virus les plus proches sont des virus retrou- 
ves chez deux chimpanzes (SIV CPZGAB, SIV ANT). 

Une importante variabilite genetique est retrouvee chez tous les 
lentivirus, et Tetude phylogenetique de ces variants obtenus a partir de nombreux points 
20 geographiques difFerents a permis de distinguer pour VIH-1, 8 sous-types (clades), 
tous egalement equidistants entre eux. Les clades ne sont qu'une representation 
mathematique de Texpression de la variabilite : I'analyse phenetique, basee non sur les 
acides nucleiques mais sur les acides amines donne des resultats difFerents (Korber et 
al, 1994), 

25 La mise en evidence de sous-types correspond a une analyse phylo- 

genetique qui n*a pas, a ce jour de correlation physiopathologique, mais une correspon- 
dance geographique. En efFet, chaque sous-type est retrouve principalement dans un 
certain espace geographique. En Europe et aux Etats-Unis, le sous-type B est majori- 
taire, alors qu'en Thailande, deux sous-types E et B sont retrouves, et qu'il existe une 

30 correlation forte entre le mode de transmission qui, en feit, correspond k une certsune 
population et le sous-type retrouve. Tous les clades ont et6 retrouves en Afrique et 
leurs distributions a travers le reste du monde reflete une probabilite de rencontre entre 



2 

personnes a comportement a haut risque. Le clade majoritaire, car present en propor- 
tion importante en Afiique est le clade A. Dans certains pays d'Afrique, une tres grande 
variabilite a ete retrouvee (G. Myers, 1994 ; P.M. Sharp et al., 1994). Plusieurs sous- 
types ont ete caracterises dans les pays d'Afrique centrale de Touest, comme la 
5 Republique Centre AfHcaine (Murphy et al, 1993) et le Cameroun (Nkengasong et al, 
1994). 

Demierement, des patients porteurs de virus variants du VIH-1, dont 
les serums posaient des problemes de detection pour certains kits commercialises sur le 
marche franfais et dont les western blots de confirmation etaient atypiques, ont ete 

10 caracterises (Loussert-Ajaka et al ; 1994; Simon et al, 1994 ; Demande Internationale 
PCT WO 96/27013). 

L'analyse de ces variants a permis de confirmer que les virus VIH de 
type 1, devaient etre sous-divises en deux groupes, le groupe M (majeur) et un groupe 
O (Outlier) incluant ces isolats, comme I'avaient propose Chameau et al, 1994. L'ana- 

15 lyse du rapport des mutations synonymes/mutations non synonymes sur les sequences 
des virus du groupe O connus, indique que ce nouveau groupe est aussi ancien, si ce 
n'est plus, que le groupe M (Loussert-Ajaka et al, 199S). Sa faibie prevalence a ce jour, 
8% des patients infectes par VIH-1 au Cameroun (Zekeng et al, 1994), et 18 cas carac- 
terises en France, serait due a des facteurs purement epidemiologiques. 

20 Ces deux groupes de VIH-1 forment un arbre en forme de double 

etoile (figures 9 a 19). Deux isolats, SIV CPZGAB, caracterise a partir d'un chimpanze 
du Gabon (Huet et al, 1990) et CPZANT, caracterise a partir d'un chimpanze du zoo 
d*Anvers ont des sequences et des organisations geniques tres proche de VIH-1, mais 
ne s'inscrivent dans aucun de ces deux groupes et forment sur I'arbre phylogenetique 

25 deux nouvelles branches. 

La mise en evidence de nouveaux variants est importante pour mettre 
au point des reactifs de depistage des infections par VIH, suffisamment sensibles et 
specifiques, c'est-a-dire ne conduisant pas a des resultats faussement negatifs ou faus- 
sement positifs et des compositions protectrices vis-a-vis de sous-types n'appartenant 

30 ni au groupe M, ni au groupe 0. 

En consequence, la Demanderesse s'est donne pour but de pourvoir a 
une souche non-M, non-0, ainsi qu'a des sequences issues de cette souche, aptes a 
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permettre la detection de variants du VIH-1 non M et non-0, qui permettent d'eviter 
Tobtention de resultats faussement negatifs ou faussement positifs. Pour ce faire, les 
Inventeurs ont notamment etabli un algorithme de difFerenciation et de confirmation 
entre les infections HIV-1 des groupes M et 0, ce qui leur a permis de selectionner des 

5 variants non-M, non-0. 

La presente invention a pour objet une souche de VIH-1 non-M non- 
0, presentant les caracteristiques morphologiques et immunologiques du retrovirus 
depose a la Collection Nationale de Cultures de Microorganismes tenue par I'lnstitut 
Pasteur sous le numero 1-1753 (denomme YBF30) le 2 juillet 1996. 

0 On entend par variant non-M non-O, un VIH de type 1, qui serologi- 

quement et moleculairement ne peut etre reconnu comme appartenant a Tun de ces 
groupes. 

La presente invention a egalement pour objet la sequence nucleoti- 
dique complete de la souche telle que definie ci-dessus (SEQ ID N°l) ainsi que des 
5 fragments d'acide nucleique d'au moins 10 nucleotides, issus de ladite souche. 
Parmi ces fragments, on peut citer : 

- LTR YBF 30 (SEQ ID N°2), 

- GAG YBF 30 (SEQ ED N*^3) (gene gag), 
. POL YBF 30 (SEQ ID N°5) (gene pol), 

0 - VIF YBF 30 (SEQ ID N*^7) (gene vif), 

- VPR YBF 30 (SEQ ID N°9) (gene vpr), 

- VPU YBF 30 (SEQ ID N^l 1) (gene vpu), 

- TAT YBF 30 (SEQ ID N^13) (gene tat), 
. REV YBF 30 (SEQ ID N*^l 5) (gene rev\ 

,5 - ENV gpl60 YBF 30 (SEQ ID N*^17) (gene env), 

- NEF YBF 30 (SEQ ID N^19) (gene nef), 

- les SEQ ED N°21-57, egalement denommees respectivement YLG, 
LPBS.l, GAG Y ASM, GAG Y ASl, GAG 6, GAG Y SI, GAG Y Sl.l, GAG Y 
S1.2, YRT AS1.3, YRT AS1.2, YRT ASl.l, YRT 2, YRT ASl, YRT 2.1, YRT 2.2, 

10 YRT 2.3, YRT 2.4, 4481-1, 4481-2, 4235.1, 4235.2, 4235.3, 4235.4, SK69.6, 
SK69.5, SK69.4, SK69.3, SK69,2, SK69.1, SK68.1, SK68.2, SK68.3, LSI AS1.3, LSI 
AS 1.2, LSI ASl.l, LSI A1,YLPA, ainsi que toute sequence, qui n*est pas identique a 



rt;i/irK5r//uzz^7 



4 

Tune des sequences nucleotidiques ci-dessus ou n'est pas coraplementaire de Tune de 

ces sequences, mais est neanmoins susceptible de s'hybrider, de maniere specifique, 

avec une sequence nucleique issue d'un virus VIH-1 non-M, non-0. 

De telles sequences trouvent application dans Tidentification speci- 
5 fique d'un VIH-1 non-M non-0, comme reactif de diagnostic, seules ou en pool avec 

d'autres reactifs, pour T identification differentielle de n'importe quel VTH-l. 

Ces sequences peuvent notamment etre mises en oeuvre dans des tests de diagnostic 

comprenant, soit une hybridation directe avec la sequence virale a detecter, soit une 

amplification de ladite sequence virale, en utilisant comme amorces ou comme sondes, 
0 un oligonucleotide comprenant au moins 10 nucleotides, inclus dans Tune quelconque 

des sequences ci-dessus et notamment Tune des sequences SEQ ID N®21-57 precitees. 

La presente invention a egalement pour objet des VEH-l, caracterises 

en ce qu'ils sont distincts a la fois du groupe M et du groupe O et presentent les 

caracteristiques suivantes : 
5 . * peu ou pas de reactivite serologique vis-a-vis des proteines des 

groupes M et 0 et forte reactivite serologique vis-a-vis des proteines issues de la 

souche YBF30 ou de la souche SIV CPZGAB ; 

^ absence d'amplification genomique a Taide des amorces des 

regions env et gag des VEH-l des groupes M et O ; 
} * amplification genomique en presence des amorces issues de la 

souche YBF30, telles que definies ci-dessus ; et 

* homologie des produits du gene d'enveloppe > 70 % vis-a-vis de la 

souche YBF30. 

L'invention a egalement pour objet Tutilisation des sequences 
5 decrites ci-dessus pour la mise en oeuvre d'un procede d'hybridation et/ou 
d' amplification genique de sequences nucleiques de type VIH-1, ces procedes etant 
applicables au diagnostic in vitro de Tinfection potentieile d'un individu par un virus du 
type VIH-1 non-M non-0. 

Ce procede de diagnostic in vitro est realise a partir d'un echantillon 
) biologique (serum ou lymphocyte circulant) et comprend : 

. une etape d'extraction de Tacide nucleique a detecter, appartenant 
au genome du virus, eventuellement present dans Techantillon biologique et, le cas 
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echeant, une etape de traitement de Tacide nucleique, a I'aide d'une transcriptase inver- 
se, si ce dernier est sous forme d* ARN, 

. au moins un cycle comprenant les etapes de denaturation de I'acide 
nucleique, d'hybridation avec au moins une sequence conforme a Finvention et even- 
5 tuellement, si necessaire, extension de Thybride forme, en presence de reactifs conve- 
nables (agent de polymerisation, tel qu'ADN polymerase et dNTP) et 

. une etape de detection de la presence eventuelle de Tacide 
nucleique appartenant au genome d'un virus de type VIH-1 de groupe non-M non-0. 

Les conditions mises en oeuvre pour la PCR a Taide des amorces 
10 issues de la souche YBF30 sont les suivantes : 

- Extraction de TADN lymphocytaire par la technique phenol-chloro- 
fome et quantification par spectrophotometrie a une longueur d'onde de 260 nm. 
Toutes les amplifications sont realisees sur Perkin Elmer thermocycler 2400. 

- Les PCR longues (9 kb) sont realisees avec le kit XL PCR (Perkin 
15 Elmer) selon les conditions du fabriquant et avec les dNTP, les tampons foumis et le 

« hot start » de Perkin Elmer ; les cycles d' amplification de cette PCR longue sont : 
. 1 cycle de denaturation pendant 2 minutes a 94*'C, 
. puis 16 cycles : 15 secondes a 94°C, 15 secondes a 55^C, 8 minutes 

a68°C, 

20 . puis 24 cycles : 15 secondes a 94°C, 15 secondes a 55°C, 8 minutes 

a 68*'C, en ajoutant a chaque cycle 15 secondes de plus (incrementation). 

- Les PCR nichees sont realisees sur les produits d' amplification des 
PCR longues. Les conditions de realisation des PCR nichees sont : 

. tampon et enzyme Taq polymerase « Expand High Fidelity PCR 
25 System » de Boehringer Mannheim selon les instructions du fabriquant, dNTP et « hot 
start » de Perkin Elmer, 

. 200 ^iM de chaque dNTP, 20 pmol de chaque amorce selon 
rinvention, 5 jil d'ADN, 10 |il de tampon PCR lOX, 2,6 unites de Taq polymerase 
dans un volume de 100 (il, 
30 . amplification : un cycle de 2 minutes a 94T, suivie de 38 cycles : 

15 secondes a 94^C, 15 secondes a SS^'C, un temps d'elongation a ITC variable selon 



6 

la taille du produit de PCR a amplifier (de 30 secondes a 2 minutes) et un dernier cycle 
d'elongation de 10 minutes a 72X. 

La detection du produit amplifie est realisee de preference par 
sequen^age direct. 

5 L' invention a egalement pour objet un peptide ou un fragment pepti- 

dique, caracterise en ce qu'il est susceptible d'etre exprime par une souche de VIH-1 
non-M non-0 ou a Taide d'une sequence nucleotidique telle que definie ci-dessus et en 
ce qu'il est apte : (1) a etre reconnu par des anticorps induits par un VIH-1 non-M 
non-0, tel que defini ci-dessus et hotamment la souche YBF30 ou un variant de celle-ci 

0 et presents dans un echantillon biologique obtenu apres une infection par une souche de 
VIH-1 non-M non-0 et/ou (2) a induire la production d*anticorps anti-VIH-1 non-M 
non-0. 

Parmi ces peptides, on peut citer, en particulier ceux issus de la 
souche YBF30 et notamment : celui exprime par le gene gag (SEQ ID 4). celui 

5 exprime par le gene pol (SEQ ID 6), celui exprime par le gene V7/(SEQ ID N*" 8), 
celui exprime par le gene vpr (SEQ ID N** 10), celui exprime par le gene \pu (SEQ ID 
12), celui exprime par le gene to/ (SEQ ID 14), celui exprime par le gene rev 
(SEQ ID N"* 16), celui exprime par le gene env (SEQ ID 18) ou Tun de ses frag- 
ments, tel qu'un fragment de la region de la boucle V3 

0 CTIU>GNNTGGQVQIGPAMTFYNIEKIVGDERQAYC (SEQ ID 58) et celui 
exprime par le gene rtef (SEQ ID N° 20) ou un fragment de ceux-ci aptes a reconnaitre 
les anticorps produits lors d'une infection par un VIH-1 non-M non-0 tel que defini ci- 
dessus. 

L'invention a egalement pour objet des compositions inmiunogenes 
S comprenant un ou plusieurs produits de traduction des sequences nucleotidiques selon 
rinvention et/ou Tun des peptides tels que definis ci-dessus, obtenus notanmient de 
maniere synthetique. 

L' invention a egalement pour objet les anticorps diriges contre I'un 
ou plusieurs des peptides decrits ci-dessus et leur utilisation pour la mise en oeuvre de 
0 methodes de diagnostic in vitro, notamment differentielle, de I'infection d'un individu 
par un virus de type VIH-1, selon les procedes connus de I'honmie du m6tier. 
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La presente invention englobe 1' ensemble des peptides aptes a etre 
reconnus par des anticorps isoles a partir d'un serum infectieux obtenu apr^s une 
infection par une souche VIH-1 non-M non-0 et les peptides aptes a etre reconnus par 
un anticorps selon Tinvention. 
5 L' invention a, en outre, pour objet une methode de diagnostic in 

vitro d'un VTH-1 non-M non-0, caracterisee en ce qu'elle comprend la mise en contact 
d'un ecliantiilon biologique preleve chez un patient, avec des anticorps selon la reven- 
dication 10, eventuellement associes a des anticorps anti-SIV CPZGAB et la detection 
des complexes immunologiques formes entre les antigenes de VIH-1, eventuellement 
10 presents dans Techantillon biologique et lesdits anticorps. 

L'invention a egalement pour objet une trousse de diagnostic de 
VIH-1, caracterisee en ce qu'elle inclut au moins un reactif selon Tinvention. 

Outre les dispositions qui precedent, T invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a des 
IS exemples de mise en oeuvre du procede objet de la presente invention ainsi qu'aux 
dessins annexes, dans lesquels : 

- les figures 1 a 7 illustrent I'emplacement des differentes amorces sur 
le genome de la souche Y6F30 ; 

- la figure 8 illustre Torganisation genomique de la souche YBF30 ; 
20 - les figures 9 a 16 representent T analyse phylogenetique des difFe- 

rents genes de la souche YBF30 par rapport au VIH-1 de groupe M et de groupe O 
(figure 9 : gene Itr, figure 10 : gene gag, figure 11 : gene tat, figure 12 : gene rev, 
figure 13 : gene v//, figure 14 : gene env gpl20, figure 15 : gene env gp41, figure 16 : 
gene nef, figure 17 : gene pol, figure 18 : gene vpr, figure 19 : gene vpu) ; 
25 - la figure 20 illustre le pourcentage de distance genetique entre 

YBF30 et VIH-l/SIV CPZGAB. 

II doit €tre bien entendu, toutefois, que ces exemples sont donnes 
uniquement a titre d'illustration de Tobjet de Tinvention, dent ils ne constituent en 
aucune maniere une limitation. 
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EXEMPLE : Obtention d'un variant VIH-1 non-M non-O selon 1' invention 
(YBF30) et ses applications. 

Ceci a en particulier ete possible en etudiant Tepidemiologie de Tin- 
fection par les virus de rimmunodeficience humaine acquise (VM) au Cameroun, qui 
5 est particulierement paradoxale. Dans ce pays, la diversite des souches est remarquable, 
puisque la plupart des sous-types connus a ce jour des virus VTH-1 du groupe M 
(Majeur) ont ete rapportes. Des cas d'infections par des virus VTH-1 hautement diver- 
geants du groupe O (O pour outlier) ont ete rapportes, presque exclusivement chez des 
patients d*origine camerounaise. Des cas d'infections par VIH-2, HTLV-1 et HTLV-2 
10 sous-type A et B ont ete egalement rapportes. 

Sur la base des resultats des evaluations serologiques et genotypiques 
anterieures, les Inventeurs ont etabli un algorithme de difFerenciation et de confirmation 
entre les infections VIH-1 des groupes M et O, afin de selectionner des variants non- 
M, non-0. 

15 Ces methodes ont ete appliquees sur des echantillons adresses au 

Laboratoire National de Reference des infections a VIH de Yaounde et ont permis de 
caracteriser un isolat VIH hautement divergeant et de definir les outils de caracterisa- 
tion d'un nouveau groupe VlH-1, compte tenu des homologies observees entre cette 
souche humaine YBF30 et la souche simienne SIV CPZGAB. 

20 I - Moven de caracterisation serologiqne du variant YBF30 lors de I'etude epidemin^ 

1) Recueil des echantillons : 

Tous les serums de patients adultes adresses au Laboratoire de refe- 
rence de Yaounde en 1994 et 1995 pour depistage ou confirmation d'une infection HIV 
25 ont ete etudies (n=883 1). 

2) Differenciation ^erologique gntrg VIH-1 group? M et groupe O gt 
selection des variants : 

En cas de positivite du depistage anti-VM (EIA indirect mixte HIV- 
1 et HIV-2 Genelavia Mixt, Sanofi-Pasteur, Paris, France), un test EIA base sur le 
30 principe de la competition vis a vis d'antigene specifique du groupe M (Wellcozyme 
Rec HIV-1, Murex, Dartford, UK), a ete associe. 
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En cas de positivite du test de type competitif Wellcozyme Rec HTV- 
1, avec ratio de reactivite en densite optique (DO) par rapport a la valeur seuil ou cut- 
off (CO) superieur a 5 (CO/DO >5), le serum est considere comme VIH-1 positif, 
resultat qui doit etre confirme sur un nouveau prelevement. 
5 Le choix d'un ratio de reactivite superieur a 5 pour considerer le test 

par competition comme test de confirmation de i4nfection a VIH-1 est base sur I'expe- 
rience acquise par le laboratoire de virologie de Thopital Bichat : sur 7200 echantillons 
reactifs avec un ratio > 5, tous presentaient un Western Blot VIH-1 (WB, New Lav 
Blot 1, SDP, Mames la Coquette) fortement positif En dehors des cas de sero- 

10 conversions VIH-1, les echantillons confirmes VIH positifs et presentant un ratio 
Wellcozyme < 5, correspondent soit a des infections par VIH-2, soit a des infections 
par VIH-1 du groupe O ou d'autres variants. 

Pour eliminer les reactions faussement positives en depistage EIA 
mixte, les echantillons presentant un ratio CO/DO < 5 sont systematiquement testes par 

15 un EIA mixte HIV-l/HIV-2 de troisieme generation (Enzygnost Plus, Marburg, 
Germany) incluant les antigenes des VIH-1 des groupes M et 0 (recombinant gp41 de 
la souche MVP5180). En cas de positivite de ce test, un test rapide discriminant HTV-l 
et HIV-2 (Multispot, SDP, Mames la Coquette) et un Western Blot (WB, New Lav 
Blot 1 ou 2, SDP) sont realises, 

20 3) Confirmation serologique des infections VTH-1 groupe O et 

variants . 

Tous les echantillons presentant un ratio CO/DO < 5, difFerencies 
positifs par WB (criteres de positivite : 2 ENV +/- POL +/- GAG ou 1 ENV +POL +/- 
GAG) et HIV-1, sont testes par un test Dot-blot utilisant des antigenes peptidiques des 
25 regions V3 et transmembranaires (InnoLia, Innogenetics, Ghent, Belgium). 

4) Isolement retroviral des souches de groupe O et des variants. 
Les cellules mononucleees sanguines peripheriques (PBMC) des 
patients seropositifs ont ete isoles par gradient de Ficoll-Hypaque au Cameroun, 
conservees et transportees a Paris en azote liquide. 
30 Apres decongelation, les PBMC des patients ont ete cocultives avec 

des lymphocytes de donneurs caucasiens seronegatifs. La replication virale dans les 
sumageants de cultures a ete mise en evidence par la detection de Tactivite transcrip- 



rv^i/rter//U4AA/ 



10 

tase inverse et par la recherche de TAntigene p24 (Elavia p24 polyclonal, SDP) sur une 
periode d'un mois. 

5) Sequences : 

Les produits des PCR sont visualises sur gels d'agarose de 1 a 1,4 % 
5 selon la taille des fragments, precipites en acetate de sodium 3M (1:10) et 3 volumes 
d'ethanol absolu, incubes 30 minutes a -80X, centrifuges 20 minutes a 13 000 rpm. Le 
culot est seche puis repris avec 10 |il d'eau distillee (Sigma), La purification est realisee 
sur « Qiaquick Gel Extraction kit » (Qiagen) selon les instructions du fabriquant ; les 
produits sont sequences avec le Kit Dye Terminator Applied Biosystem sur un auto- 
10 mate DNA Sequencer (Applied Biosystems, Inc., Foster Cit, CA), comme decrit 
precedemment (Loussert-Ajaka et al, 1995) ; les sequences nucleotidiques sont analy- 
sees sur logiciel Sequence Navigator (Applied Biosystems), alignes avec le logiciel 
GeneWorks (Intelligenetics Inc.). 

6) Analyses phvlogenetiques : 

15 Les sequences ont ete alignees avec le logiciel CLUSTAL pour les 

alignements multiples, en prenant comme matrice de reference, les alignements de la 
compilation des sequences VIH du laboratoire de Biologie et de Biophysique 
Theorique de Los Alamos, New Mexico, 87545 USA. 

Les analyses phylogenetiques ont ete faites avec le logiciel PHYLIP ; 

20 dans un premier temps, les distances ont ete calculees avec DNADIST, puis Tanalyse 
phylogenetique a ensuite ete realisee avec NEIGHBOR JOINING ou FITCH ; enfin, 
les arbres ont ete dessines avec DRAWTREE (figures 9 a 19). Les pourcentages de 
distance genetique sont egalement illustres a la figure 20. 

Pour les analyses de « boostrapping », SEQBOOT a d'abord ete uti- 

25 lise, suivi de DNADIST et NEIGHBOR-JOINING ou FITCH. Enfin les valeurs de 
boostrap ont ete obtenues avec CONSENS. 

II - Resultats de renqnete de mise en evidence des VIH groupe O et variant : 

174 echantillons, parmi 3193 echantillons positifs au depistage, ont 
ete consideres soit groupe O, soit groupe M avec reactivite serologique anormale, soit 
30 comme variants. 
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ni - Mis e en evidenc fijiliiLi ghantillQn non gro upe O eLiiQii groupe M presentant nne 

Les 174 seaims HIV-1 positifs par WB (Western Blot), mais reactifs 
avec un ratio CO/DO < 5 en EIA de type competitif ont ete testes par dot blot LIA de 
5 difFerenciation sur les peptides V3 du groupe M, groupe 0 et SIV CPZGAB : 

- 7 ne reagissent sur aucun des peptides (M, O ou SIV CPGGAB) 
representes. L'absence de coUecte cellulaire ne permet aucune conclusion. 

- 82 presentent une reactivite vis a vis d'au moins un des peptides 
correspondant a la boucle V3 des souches du groupe O. La frequence des reactions 

10 croisees est faible et limitee aux epitopes correspondant aux regions V3 consensus 
(1 1 %) et SIV-CPZ GAB (43 %) . 

- 84 serums sont non reactifs vis-a-vis des epitopes du groupe O. Ces 
prelevements ont ete realises majoritairement chez des patients presentant un SDDA 



exclusivement avec le peptide SIV CPZGAB. Cette reactivite isolee wis a vis d'un anti- 
gene du SIV CPZGAB n'a jamais ete decrite auparavant. Des lymphocytes ayant ete 
collectes chez la patiente, la caracterisation \irologique de cette souche nommee 
YBF30 a pu etre poursuivie. 

20 IV - Resultats des examens serologiques et virolngiqne<; s^nr \e<^ prm^^^^i prfilfiVqmfintS 



(75/84). 
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un serum, preleve chez une patiente camerounaise (NJ) est reactif 




ir cette patiente (mm 1 QQS^i fN<> serum : 95-6295) : 

1) Tests ELISA commerciaux (Densite optique/valeur seuil) 

Critere de positivite : DO/CO > 1 

Genelavia = >15 

Wellcozyme CO/DO = 1,55 

Abbott Plus = >15 

Behring Plus= 4,2 

2;^ Western blot 



25 



WB New Lav 1 Pasteur : 



30 



160++, 120-H-, 68++,55+, 41+, 40+/-, 34++, 24++, 18+ 
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3) LIA dot-Blot Innogenetics 

Negatif pour toutes les bandes groupe O et groupe M sauf V3 SIV 

CPZGAB 

4) Resultats des examens serologiques de recherche sur peptides 
5 specifiques des groupes M et 0 

* La technique du Pr. Francis Barin du Laboratoire de Virologie du 
CHU de Tours a ete adaptee (Barin F, et al., 1996) ; des peptides des regions trans- 
membranaires synthetises (BioMerieux) on ete utilises, pour mettre au point un test de 
difTerenciation entre les groupes M et 0. Cette technique est basee sur la competition 

0 de liaison des anticorps entre les peptides transmembranaires gp41 des groupes 0 et M 
deposes sur la phase solide et des peptides transmembranaires gp41 soit du groupe 0, 
soit du groupe M en concentration superieure en une phase liquide de reaction 
hyperosmolaire. Les resultats sent illustres au Tableau I ci-apres, dans lequel le puits 
CP correspond au temoin d'inhibition 100 % et le puits CSP correspond au controle 0 

5 % d'inhibition. 

Tableau I 



Resultats des difTerenciations inter groupe O - groupe M du serum 6295 





gp41 M 


gp410 


CP 


CSP 


6295 


0,25 


0,36 


0,12 


1,98 



Ces resultats montrent qu'il existe une forte liaison vis-a-vis des pep- 
tides de la phase solide (CSP), une nette inhibition par Vadjonction combinee des pep- 
tides M et 0 (CP) mais pas de nette difFerenciation, soit par le peptide M, soit par le 
peptide O. II existe done une evidence sdrologique que la souche infectante n'appartient 
ni au groupe M, ni au groupe 0. 

* Compte tenu tfune reactivite isolee sur le dot blot InnoLia vis-a-vis 
des antigenes V3 SIV CPZGAB, sur les memes bases de competition entre peptides, ce 
serum a ete etudie en mettant en competition les peptides gp41 M, gp41 O et gp 41 
SIV CPZGAB. 

^utilisation du serum du chimpanze denomme 'Amandine' (donne par 
M. Peeters, qui a isole la souche SIV CPZGAB, AIDS 1992) a permis, dans un pre- 
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mier temps, de valider cette technique. Sur le tableau II, les valeurs (DO) les plus 
basses indiquent le plus haut degre de liaison aux antigenes. 

Tableau n 

Resultats des difTerenciations inter groupe O - groupe M - SIVcpzGab avec le 



S serum du chimpanze Amandine et le serum 6295 





gp41 M 


gp410 


gp41 
CPZGAB 


CP 


CSP 


Amandine 


0,8 


1,4 


0,3 


0,5 


1,9 


6295 


0,7 


1,1 


0,7 


0,4 


2,1 



La reactivite du serum « Amandine » confirme et valide le test selon 
rinvention et indique que le serum de la patiente reagit de maniere identique vis-a-vis 
des peptides M et SIV CPZGAB, mais est sans reaction croisee avec le peptide O. 
10 Ces resultats montrent qu*il existe une inhibition similaire avec le 

serum de la patiente par les peptides gp41 du groupe M et gp41 SIV CPZGAB. Les 
antigenes de la souche infectante ont done donne naissance a des anticorps reconnais- 
sant, de fagon similaire, les gp 41 du groupe M et du SIV CPZGAB. 

4) Resultats obtenus a partir de I'isolement Ivmphocytaire 
15 (prelevement mai 19951 

Un retrovirus a ete isole a partir des lymphocytes preleves le 22 mai 
1995, selon les techniques classiques. La culture avec la lignee MT2 montre que la 
souche YBF30 ne forme pas de syncytia (NSI). 

V - Resultats de^ ^vamens sernlngiques sur le deuxieme prelevement (Novembre 1995) 
20 (N^ serum : 95-3371) 

1) LIA dot-Blot Innogenetics 

Negatif pour toutes les bandes, sauf V3 SIV CPZGAB 

2) Resultats des examens s erologiques de recherche sur peptides 
sp^cifiques dg? grqupg? M et 

25 Le Tableau III illustre les resuhats des difFerenciations gp41 inter 

groupe O - groupe M - SFV CPZGAB avec le serum 3371. 
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Tableau m 

Resultats des differenciations gp41 inter groupe O - groupe M - 
SIV CPZGAB avec le serum 3371 





gp41 M 


gp410 


gp41 cpz-gab 


CP 


CSP 


3371 


1,31 


1,7 


0,89 


0,54 


2,02 



5 Ces resultats confirment sur ce nouveau prelevement (efFectue chez 

la meme patiente, en phase terminale de la maladie) qu*il existe une inhibition marquee 
avec le serum de la patiente par le peptide gp41 SIV CPZGAB. 

Les antigenes de la souche infectante ont done induit des anticorps 
reconnaissant de fa9on preferentielle la gp 4 1 du SIV CPZGAB, 
10 3) Resultats de Tisolement lymphocytaire (prelevement novembre 95 

(95-3371.YBF31)) 

Un retrovirus a ete isole a partir des lymphocytes preleves en novem- 
bre 1995, selon les techniques classiques et denomme YBF31 ; les elements de 
sequence sont identiques a ceux de YBF30. 
15 VI - Amplification genomique et Sequences de YRF 10 

L'ADN pour toutes les manipulations de PCR est extrait a partir des 
cellules de fin de culture positive. 

Les PCR realisees avec les amorces VIH-1 groupe O dans difFerentes 
regions testees sont negatives (gag, pol, env) . De meme, celles realisees avec les 
20 amorces specifiques du VIH-1 groupe M sont negatives. 

Les conditions d'ampUfication et d'hybridation pour les PCR du 
groupe O sont realisees dans les conditions decrites dans Loussert-Ajaka, 1995. Les 
conditions d'ampUfication et d*hybridation pour les PCR du groupe M sont celles 
decrites par les Auteurs cites ci-apres. 
25 Ces amorces groupe M sont positionnees selon la sequence HIV-1- 

HXB2: 

. Dans Vem gpl20 : ED3/ED12 (position 5956-5985 ; 7822-7792) ; 
ED5/ED14 (6556-6581 ; 7960-7931) ; ED5/ED12 ; ED3/ED14 ; ES7/ES8 (7001- 
7020 ; 7667-7647) (Delwart et al. Science 1993; 262 : 1257-1261 ). 
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- Dans Venv gp4 1 : premiere PCR ED3/M29, suivie d'une PGR nichee 
M28/M29 (7785-7808 ; 8099-8124) ; M28/M29 presentent les sequences suivantes: 
M28 : CGGTTCTT(AG)GGAGCAGC(ACT)GGAAGCA, 

M29 : T(CT)T(ACGT)TCCCA(CT)T(AT)(CT)A(AGT)CCA(AGT)GTCAT ; 
5 SK68/SK69 (Ou et al. Science, 1988; 239: 295-297). 

- Dans le gag : Amplicor Roche Diagnostics systems ; amorces gag 
nichees (Loussert-Ajaka et al. Lancet 1995; 346: 912-913) ; SK38/SK39 (Ou et al., 
Science, 1988; 239: 295-297). 

- Dans lepol : A/NEl (Boucher et al., Lancet, 1990; 336: 585-590) ; 
10 Pol3/Pol4 (Laure et al.. Lancet, 1988, ii, 538-541 ). 

Seules les PCR realisees avec les amorces H Pol sont positives 
(4235/4538) suivie d'une PCR nichee avec les amorces 4327/4481 (Fransen et al. 
Molecular and Cellular Probes 1994; 8: 31 7-322). Ce fragment H Pol, localise dans 
I'integrase (260 pb), a ete sequence. L'amplification avec les amorces HPOL est rendue 

15 possible, en raison de I'exces de virus. En eSet, TADN utilise est extrait des cellules de 
fin de culture fortement positive (transcriptase inverse > 100.000 cpm). L'amplification 
de TADN extrait des cellules fi-aiches sans coculture est impossible de par le nombre 
important de mesappariement entre les amorces HPOL (surtout dans la region 3') et la 
sequence de Tisolat YBF30. La conservation de cette extremite 3' est tres importante 

20 pour Tactivite d'extension de la Taq polymerase. 

1 - Sequence du gene pol : I'utilisation d' amorces tres degenerees 
pour l'amplification par RT-PCR du RNA extrait du sumageant de culture positif, a 
donne une amplification positive. Ce sont des amorces communes a tous les retrovirus 
(Donehower et al. J. Virol. Methods 1990; 28: 33-46), situes dans la region de la 

25 transcriptase inverse du gene pol. Lanalyse du fi-agment apres sequence a permis de 
g^nerer une amorce specifique YRT2 (SEQ ID N** 32) de I'lsolat YBF30 et d'amplifier 
le gene pol en utilisant Tamorce Hpol 4481 (Fransen et al., 1994 precite), comme 
amorce anti-sens. La sequence du fragment a ete realisee en synthetisant au fur et a 
mesure des amorces specifiques pour chaque fragment genere (Figure 1). 

30 2 - Sequence du gene env : la deuxieme approche a ete de faire une 

PCR longue (XL-PCR, Perkm Elmer) amplifiant tout le virus (9000 pb) en utilisant des 
amorces situees dans le LTR : LPBS 1 (SEQ .E> N**22) ; LSiGi, suixae tfune PCR 
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nichee avec YRT2 (SEQ ID 32)/SK69 de 6000 pb. et de sequencer toute Tenve- 
loppe en suivant la meme procedure. La sequence de la region gp41 a ete realisee en 
utilisant une PCR nichee avec les amorces SK68/LSiGi. 

3 - Sequence du gene gag : utilisation d'une PCR nichee, realisee par 
5 PCR longue (LPBS 1 /LSiGi), avec les amorces Gag 5 et Gag 1 li, et en generant au 
fiir et a mesure des amorces specifiques, afin de marcher sur le genome viral. 
VII - Resultats des sgquencQS 

La souche YBF30 a ete completement sequencee (voir liste des 
sequences). La souche YBF31 de Novembre 1995 a ete partieilement sequencee et 
10 Tabsence de variation significative confirme la validity des sequences de YBF30. 
Vin - Synthcsg de peptides dc la region de la houQic V3 dc la soughe YBF3Q. 

Uetude des sequences de la region de la boucle V3 a permis de syn- 
thetiser le peptide correspondant et de comparer les acides amines de cette region de la 
souche YBF 30 avec ceux des autres sous-types M et des souches O. 
15 Les sequences des peptides sont : 

YBF30: SEQ ID 58 

SIV CPZGAB : CHRPGNNmGEVQIGPGNlTFYNIENVYGDTRS AYC 
(SEQ ID N° 59) 

GROUPE 0 : CIRPGNRTYRNLQIGPGMTFYNVEIATGDIRKAFC 
20 (ANT70) (SEQ ID N° 60) 

GROUPE M : CTRPNNNTRKSVRIGPGQAFYATGDHGDIRQAHC 
(SS-TYPEA) (SEQ ID N° 61) 

Le peptide a ete synthetise, a partir des 2 asparagines de la region 5* 
25 de la boucle et utilise selon le mgme principe que decrit precedemment (voir IV 4)), a 
savoir en competition par rapport aux peptides du groupe M, du groupe 0 et du SIV 
CPZGAB. Les resultats illustres au Tableau IV confirment Toriginalite de cette souche 
et Textension possible de ces souches puisque les resultats serologiques sont en faveur 
d*infection du type YBF30 au Cameroun. En outre, I'etude de 200 serums selectionnes 
30 VIH-1 positifs du Cameroun met en evidence un nouveau cas presentant un profit 
similaire a celui de YBF30. 
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Tableau IV 
Etude de reactivite de 200 serums 



Serum 


Orisine 


V3A 


V3cpz 


V3YBF30 


CP 


CSP 


953371 


Cameroun 


1,66 


0,38 


1,39 


0,39 


1,64 


956295. 


Cameroun 


1,72 


0,37 


1,16 


0,51 


1,73 


967321 


Cameroun 


0.07 


0.17 


0,5 


0,05 


0.27 


Amandine 


SIVGAB 


1.74 


0,14 


1,48 


0.19 


1.74 


NO A.* 


SIVANT 


2,66 


0,31 


1.88 


0.46 


1,9 


* serum du S 


[V CPZ ANT 



5 Sur ce nouveau test, la reactivite des serums 953371 et 956295, 



correspondant a la patiente chez qui la souche Y6F30 a ete isolee, avec le peptide 
SIV-CPZ, a ete confirmee. La plus faible reactivite vis a vis de son propre antigene V3 
est classique lors des stades tardifs de la maladie. Cette reactivite reste cependant supe- 
rieure a celle relevee vis a vis du peptide M. Un autre patient camerounais (serum 
10 967321) presente le meme profil de reactivite peptidique. 
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Ainsi que .cela ressort de ce qui precede, I'invention ne se limite 
nullement a ceux de ses modes de mise en oeuvre, de realisation et d'application qui 
viennent d'etre decrits de fagon plus explicite ; elle en embrasse au contraire toutes les 
30 variantes qui peuvent venir k I'esprit du technicien en la matiere, sans s'ecarter du 
cadre, ni de la portee, de la presente invention. 
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LISTB DE SEOnEMGEg 



(1) INFORMATIONS GENERALES: 

(i) DEPOSANT: 

<A) NOM: INSTITUT NATIONAL DE LA SANTE ET DE LA 
RECHERCHE MEDICALE - INSERM 

(B) RUE: 101 rue de Tolbiac 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75654 CEDEX 13 

(A) NOM: ASSISTANCE PUBLIQUE-HOPITAUX DE PARIS 

(B) RUE: 3 avenue Victoria 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75100 RP 

(A) NOM: INSTITUT PASTEUR 

(B) RUE: 28 rue du Docteur Roiax 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75724 C6dex 15 

(A) NOM: MAUCLERE Philippe 

(Bj RUE: 2 rue Buhan 

(C) VILLE: BORDEAUX 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 33000 

(A) NOM: LOUSSERT-AJAKA Ibtissam 

(B) RUE: 26 avenue de la R^publique 

(C) VILLE: SARTROUVILLE 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 78500 

(A) NOM: SIMON Francois 

(B) RUE: 8 rue Germain Pi Ion 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75018 

(A) NOM: SARAGOSTI Sentob 

(B) RUE: 69 bis rue de Billancourt 

(C) VILLE: BOULOGNE BILLANCOURT 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 92100 

(A) NOM: BARRE-SINOUSSI Frangoise 

(B) RUE: 104 Le Capricome, 50 rue d'Erevan 

(C) VILLE: ISSY LES MOULINEAUX 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 92130 

(ii) TITRE DE L' INVENTION: SOUCHES DE VIH-1 NON-M NON-0, FRAGMENTS ET 

APPLICATIONS . 

(iii) NOMBRE DE SEQUENCES: 61 



(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D* EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentin Release #1.0, Version #1.30 (OEB) 

(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 9183 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN (g^nomique) 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID 


NO: 1: 






CTTCTCGCTT 


GTACTGGGTC 


TCTCTTGCTG 


GACCAGATTA 


GAGCCTGGGA 


GCTCTCTGGC 


60 


TAGCAGGGAA 


CCCACTGCTT 


AAGCCTCAAT 


AAAGCTTGCC 


TTGAGTGCTA 


AAGTGGTGTG 


120 


TGCCCATCCA 


TTCGGTAACT 


CTGGTACCTA 


GAGATCCCTC 


AGACCATCTA 


GACTGAGTGA 


180 


AAAATCTCTA 


GCAGTGGCGC 


CCGAACAGGG 


ACTTGAAAAC 


GAAAGTAGAA 


CCGGAGGCTG 


240 


AATCTCTCGA 


CGCAGGACTC 


GGCTCGTTGG 


TGCACACAGC 


GAGAGGCGAG 


GCGGCGGAAG 


300 


TGTGAGTACG 


CAATTTTGAC 


TGGCGGTGGC 


CAGAAAGTAG 


GAGAGAGGAT 


GGGTGCGAGA 


360 


GCGTCAGTGT 


TAACAGGGGG 


AAAATTAGAT 


CAATGGGAAT 


CAATTTATTT 


GAGACCAGGG 


420 


GGAAAGAAAA 


AATACAGAAT 


GAAACATTTA 


GTATGGGCAA 


GCAGGGAGCT 


GGAAAGATTC 


480 


GCTTGTAACC 


CAGGTCTCAT 


GGACACAGCG 


GACGGCTGTG 


CCAAGTTACT 


AAATCAATTA 


540 


GAACCAGCTC 


TCAAGACAGG 


GTCAGAAGAA 


CTGCGCTCTT 


TATATAACGC 


TCTAGCAGTT 


600 


CTTTATTGTG 


TCCATAGTAG 


GATACAGATA 


CACAACACAC 


AGGAAGCTTT 


GGACAAGATA 


660 


AAAGAGAAAC 


AGGAACAGCA 


CAAGCCCGAG 


CCAAAAAACC 


CAGAAGCAGG 


GGCAGCGGCA 


720 


GCAACTGATA 


GCAATATCAG 


TAGGAATTAT 


CCTCTAGTCC 


AGACTGCTCA 




/ oU 


GTACATCAGC 


CGCTGACACC 


CAGAACCTTA 


AATGCTTGGG 


TGAAAGTGAT 


AGAGGAGAAG 


840 


GCCTTTAGTC 


CAGAAGTAAT 


ACCAATGTTT 


ATGGCCTTGT 


CAGAAGGGGC 


AACGCCCTCA 


900 


GATCTAAATA 


CTATGTTAAA 


TACAGTAGGG 


GGACATCAGG 


CAGCAATGCA 


GATGCTGAAG 


960 


GAAGTCATCA 


ATGAGGAAGC 


AGCAGACTGG 


GATAGGACAC 


ATCCAGTCCC 


TGTGGGACCA 


1020 


CTACCCCCAG 


GGCAACTGAG 


AGACCCTAGA 


GGAAGTGATA 


TAGCAGGAAC 


AACTAGCACC 


1080 


CTGGCAGAAC 


AGGTGGCTTG 


GATGACTGCT 


AATCCTCCTG 


TTCCAGTAGG 


AGATATTTAT 


1140 


AGAAGATGGA 


TAGTCCTGGG 


GTTAAACAGA 


ATTGTGAGAA 


TGTATAGTCC 


TGTCAGCATT 


1200 


CTAGAGATCA 


AACAAGGACC 


AAAAGAACCC 


TTCAGAGACT 


ATGTAGACAG 


GTTCTACAAA 


1260 


ACTCTAAGAG 


CAGAGCAGGC 


AACACAGGAA 


GTAAAGAATT 


GGATGACAGA 


AACACTCTTA 


1320 


GTACAAAATG 


CAAACCCAGA 


TTGTAAACAG 


CTCCTAAAAG 


CATTAGGGCC 


AGGAGCTACC 


1380 


TTAGAAGAGA 


TGATGACGGC 


CTGCCAGGGA 


GTGGGGGGAC 


CAGCACATAA 


GGCAAGAGTG 


1440 



CTAGCAGAGG 


CTATGTCACA 


GGTGCAGCAG 


AACTTTAAAG 


GCATAAGGAA 


ACCCATTAAA 


GCAAGAAACT 


GTAAGGCCCC 


TAGAAGAGGA 


CAAATGAAAG 


ATTGTAAAAA 


TGAAGGAAGA 


CCCTTCAAAG 


GGAGACCAGG 


AAACTTCCCC 


CCGCCACTAG 


AGAGTTATGG 


GTTTCAGGAG 


GAGAACCAGG 


AGAGGACAGA 


GAACTCTCTG 


TTTGGCAACG 


ACCCGTCATC 


ACAGTAAAAA 


ATACAGGAGC 


TGATGATACA 


GTAATAGAAG 


AAATGATAGG 


AGGAATTGGA 


GGATTTATCA 


ACATACAGGG 


AAGAAAAGCA 


GTTGGTACAG 


TAGGAAGAAA 


TCTTTTAACC 


CAGATTGGCT 


AAACTGTACC 


AGTAAAATTA 


AAACCAGGAA 


TGACAACAGA 


AAAAATAGAG 


GCATTAAGAG 


AAATTTCTAG 


AATAGGGCCT 


GAGAATCCAT 


AAGATAGCAC 


TAAATGGAGA 


AAATTAGTAG 


ATTTTTGGGA 


AGTGCAGCTA 


GGAATTCCAC 


TGACAGTTTT 


GGATGTAGGA 


GATGCTTATT 


AGTATACAGC 


TTTTACCATA 


CCTAGTATAA 


ATAATGTGCT 


GCCACAAGGC 


TGGAAAGGGT 


AAATTCTAGA 


ACCATTCAGA 


GAGAAACATC 


ACCTCTATGT 


GGGATCTGAC 


TTAGAACTAG 


GAGATCATCT 


TTTGAAGTGG 


GGCTTTACGA 


CGTTCCTCTG 


GATGGGATAT 


GAACTCCATC 


TACCAGAAAA 


GGATGTATGG 


ACTGTCAATG 


GGGCAAGTCA 


GATCTATCCA 


GGAATCAGAG 


CCAAAGCTTT 


GACAGAAGTA 


GTCAACTTTA 


ACAGGGAGAT 


ATTAAAAGAA 


CCCCTGCATG 


TAGCAGAAAT 


TCAAAAGCAA 


GGACAAGGTC 


ATAAAAATTT 


AAAAACAGGA 


AAGTATGCAA 


AACAGTTAGT 


TGAAGTGGTA 


AGGAAAGTGG 


CTCCTAAATT 


TAGATTACCA 


GTACAAAAGG 


GGCAAGCAAC 


TTGGATTCCT 


GAGTGGGAAT 
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CCAACAACTA GTGTCTTTGC ACAAAGGGGA 1500 
TGTTTCAATT GTGGCAAAGA GGGCCATTTG 1560 
GGCTGTTGGA AGTGTGGGCA AGAAGGACAT 1620 
CAGGCTAATT TTTTAGGGAA GAGCTGGTCT 1680 
CAGACAACAA CAAGGAAAGA GCCCACAGCC 1740 
GAGAAGAGCA CACAGGGGAA GGAGATGCAG 1800 
TACCCACCTT TAACTTCCCT CAGATCACTC 1860 
TAGGGAAAGA AGTAAGAGAA GCTCTTTTAG 1920 
AGCTACAATT AGAGGGAAAA TGGAAACCAA 1980 
AAGTGAGACA ATATGATAAT ATAACAGTAG 2040 
TATTAGTAGG ACCAACACCT GTTAATATTA 2100 
GTACTTTAAA TTTTCCAATA AGTCCTATTG 2160 
TGGATGGCCC AAAGGTAAAA CAATGGCCTT 2220 
AAATTTGTAC AGAAATGGAA AAGGAAGGAA 2280 
ATAACACTCC AATTTTTGCT ATAAAAAAGA 2340 
ATTTCAGGGA ATTAAATAAA AGGACCCAAG 2400 
ATCCAGCAGG ATTAAAGCAG AAAAAATCAG 2460 
TTTCATGTCC CTTGGACAAA GATTTTAGAA 2520 
ACAATGAGAC ACCTGGTATT AGATACCAGT 2580 
CACCAGCAAT TTTTCAGAGT ACAATGACAA 2640 
CAGAGATAAT CATTTACCAG TACATGGATG 2700 
CACAACATAG AGAGGCAGTA GAAGACCTTA 2760 
CCCCTGACAA AAAACATCAG AAGGAACCCC 2820 
CAGACAAATG GACAGTCCAG CCAATAAAGT 2880 
ATATACAGAA ATTAGTAGGA AAGTTAAATT 2940 
TAAAACAGCT CTGTAAATTA ATCAGAGGAA 3000 
CAGAAGAAGC AGAATTAGAA CTAGCAGAAA 3060 
GAGTCTATTA TGACCCAGGA AAAGAATTAG 3120 
AGTGGACATA TCAGATTTAT CAGGAGTTAC 3180 
AAATGAGATC TGCCCATACT AATGATATAA 3240 
CAACAGAAAG TATAGTAATT TGGGGAAAGA 3300 
AAGTGTGGGA GGCATGGTGG ACCGATCATT 3360 
TTGTCAACAC TCCTCCCCTT GTAAAATTAT 3420 
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GGTATCAGTT 


AGAAACAGAG 


CCAATCAGTG 


GGGCAGAAAC 


TTTCTATGTA 


GATGGAGCAG 


3480 


CTAATAGGGA 


AACAAAATTG 


GGAAAAGCAG 


GTTTTGTGAC 


AGATAGGGGA 


AGACAGAAAG 


3540 


TGGTCTCTAT 


TGCAGACACC 


ACCAATCAAA 


AGGCTGAGTT 


ACAAGCTATC 


CTTATGGCCT 


3600 


TACAAGAGTC 


AGGACGGGAT 


GTAAACATAG 


TCACTGACTC 


TCAGTATGCT 


ATGGGAATAA 


3660 


TTCATTCACA 


GCCAGATAAA 


AGTGAATCAG 


AATTGGTGAG 


CCAAATAATA 


GAAGAGCTCA 


3720 


TAAAAAAGGA 


AAGAGTTTAT 


CTCTCTTGGG 


TACCTGCACA 


TAAAGGTATT 


GGAGGAAATG 


3780 


AGCAGGTAGA 


CAAATTAGTT 


AGCTCAGGAA 


TTAGAAAAAT 


ATTATTCCTA 


GATGGTATAG 


3840 


AAAAAGCCCA 


AGAAGATCAT 


GACAGATATC 


ACAGCAATTG 


GAAAGCAATG 


GCCAGTGATT 


3900 


TTAACTTACC 


CCCCATAGTG 


GCAAAAGAAA 


TAGTAGCCAG 


CTGtGACAAA 


TGCCAGCTAA 


3960 


AAGGGGAAGC 


CATGCATGGA 


CAGGTCAATT 


GTAGTCCAGG 


AGTGTGGCAA 


TTAGATTGTA 


4020 


CACACTTAGA 


GGGAAAAATC 


ATCCTTGTGG 


CGGTCCATGT 


GGCCAGTGGC 


TACTTAGAAG 


4080 


CAGAAGTTAT 


TCCTGCAGAG 


ACAGGACAGG 


AAACAGCATA 


TTTTATTTTA 


AAGTTAGCTG 


4140 


GAAGATGGCC 


AGTAAAAGTT 


ATACACACTG 


ATAATGGATC 


CAATTTCACT 


AGTGCCACTG 


4200 


TAAAAGCAGC 


CTGTTGGTGG 


GCAAATATCA 


AACAGGAATT 


TGGGATACCC 


TACAATCCTC 


4260 


AAAGTCAGGG 


AGCAGTAGAG 


TCCATGAATA 


AAGAATTAAA 


GAAAATTATA 


GGACAAATCA 


4320 


GAGATCAAGC 


AGAACATCTA 


AAGACAGCAG 


TGCAAATGGC 


GGTTTTCATT 


CACAATTTTA 


4380 


AAAGAAAAGG 


GGGGATTGGG 


GGGTACACTG 


CAGGGGAAAG 


AATAATAGAC 


ATAATAGCAA 


4440 


CAGACATACA 


GACAACAAAT 


TTACAAACAC 


AAATTTTAAA 


AGTTCAAAAT 


TTTCGGGTTT 


4500 


ATTACAGAGA 


CAGCAGAGAT 


CCCATTTGGA 


AAGGACCAGC 


CAAACTTCTG 


TGGAAAGGAG 


4560 


AAGGGGCAGT 


GGTAATTCAA 


GATAACGGGG 


ATATAAAAGT 


AGTCCCACGT 


AGGAAAGCAA 


4620 


AAATAATTAG 


GGATTATGGA 


AAACAGATGG 


CAGGTGATGG 


TTGTGTGGCA 


AGTGGACAGG 


4680 


ATGAAAATCA 


GGAAATGGAA 


TAGCTTAGTA 


AAACATCATA 


TGTATGTGTC 


AAAAAAGGCA 


4740 


AAAGGATGGT 


ATTATAGACA 


TCATTATGAA 


ACACATCACC 


CAAAAATAAG 


TTCAGAAGTA 


4800 


CATATCCCAG 


TAGGTCAGGC 


AAGATTAGTG 


ACAGTCACTT 


ATTGGGGGCT 


AACAACAGGA 


4860 


GAACAGTCTT 


GGCATCTAGG 


ACATGGAGTA 


TCCATAGAAT 


GGAGACTAAG 


AAAATACAAG 


4920 


ACACAAGTTG 


ATCCTGAAAT 


GGCAGACAAG 


CTAATACATC 


TTCATTATTT 


TGATTGTTTT 


4980 


ACAGCCTCTG 


CCATAAGGCA 


AGCGGTCTTA 


GGGAGACCAG 


TATTACCTAG 


GTGTGAATAT 


5040 


CCAGCAGGGC 


ACAAACAGGT 


AGGCACCCTA 


CAATATCTAG 


CACTAACAGC 


CTGGGTGGGA 


5100 


GCAAAGAAGA 


GAAAGCCACC 


CTTACCTAGT 


GTGACTAAGC 


TAACAGAAGA 


TAGATGGAAC 


5160 


GAGCACCAGA 


AGATGCAGGG 


CCACAGAGGG 


AACCCTATAA 


TGAATGGGCA 


CTAGAATTAT 


5220 


TAGAAGAATT 


AAAAAATGAA 


GCTGTGCGCC 


ATTTTCCAAG 


GATTTGGCTA 


CATGGGTTAG 


5280 


GACAACACAT 


CTATAACACA 


TATGGAGACA 


CCTGGGAGGG 


GGTAGAGGCA 


ATTATCAGGA 


5340 


TACTACAACA 


ATTACTGTTT 


ATCCATTATA 


GGATTGGCTG 


CCAGCACAGC 


AGAATAGGGA 


5400 
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TCACTCCTCA 


AAGGAGAAGG 


AATGGAACCA 


GTAGATCCTA 


GATTAGAGCC 


CTGGAATCAT 


5460 


CCAGGAAGCC 


AACCTAAAAC 


AGCTTGCAAT 


AATTGCTATT 


GTAAAAGATG 


TTGCTATCAC 


5520 


TGCTTATATT 


GCTTCACAAA 


GAAAGGCTTA 


GGCATCTCAT 


ATGGCAGGAA 


GAAGCGGAGT 


5580 


CAACGACGAA 


GAACTCCTCA 


GAGCAGTAAG 


AGTCATCAAG 


ATCTTATACC 


AGAGCAGTAA 


5640 


GTAAAACCTG 


TATATATGCT 


GTCATTGGGA 


TTCATAGCGT 


TAGGAGCAGC 


AGTTAGCATA 


5700 


GCAGTAATAG 


TCTGGGCATT 


ACTATATAGA 


GAATATAAGA 


AAATAAAATT 


GCAGGAAAAA 


5760 


ATAAAACACA 


TAAGACAGAG 


AATAAGAGAA 


AGAGAAGAAG 


ATAGTGGCAA 


TGAAAGTGAT 


5820 


GGGGATGCAG 


AGTGGTTGGA 


TGGGGATGAA 


GAGTGGTTGG 


TTACTCTTCT 


ATCTTCTAGT 


5880 


AAGCTTGATC 


AAGGTAATTG 


GGTCTGAACA 


ACATTGGGTA 


ACAGTGTACT 


ATGGGGTACC 


5940 


AGTATGGAGA 


GAAGCAGAGA 


CAACTCTTTT 


CTGTGCTTCA 


GATGCTAAAG 


CCCATAGTAC 


6000 


AGAGGCTCAC 


AACATCTGGG 


CCACACAAGC 


ATGTGTTCCT 


ACTGATCCCA 


ATCCACAAGA 


6060 


AGTGCTATTA 


CCCAATGTAA 


CTGAAAAATT 


TAATATGTGG 


GAAAATAAAA 


TGGCAGACCA 


6120 


AATGCAAGAG 


GATATTATCA 


GTCTGTGGGA 


ACAGAGCTTA 


AAGCCCTGTG 


TTAAATTAAC 


6180 


CCCATTATGT 


GTAACTATGC 


TTTGTAACGA 


TAGCTATGGG 


GAGGAAAGGA 


ACAATACAAA 


6240 


TATGACAACA 


AGAGAACCAG 


ACATAGGATA 


CAAACAAATG 


AAAAATTGCT 


CATTCAATGC 


6300 


AACCACTGAG 


CTAACAGATA 


AAAAGAAGCA 


AGTTTACTCT 


CTGTTTTATG 


TAGAAGATGT 


6360 


AGTACCAATC 


AATGCCTATA 


ATAAAACATA 


TAGGCTAATA 


AATTGTAATA 


CCACAGCTGT 


6420 


GACACAAGCT 


TGTCCTAAGA 


CTTCCTTTGA 


GCCAATTCCA 


ATACATTACT 


GTGCACCACC 


6480 


AGGCTTTGCC 


ATTATGAAAT 


GTAATGAAGG 


AAACTTTAGT 


GGAAATGGAA 


GCTGTACAAA 


6540 


TGTGAGTACT 


GTACAATGCA 


CACATGGAAT 


AAAGCCAGTG 


ATATCCACTC 


AGTTAATCCT 


6600 


AAATGGAAGC 


TTAAATACAG 


ATGGAATTGT 


TATTAGAAAT 


GATAGTCACA 


GTAATCTGTT 


6660 


GGTGCAATGG 


AATGAGACAG 


TGCCAATAAA 


TTGTACAAGG 


CCAGGAAATA 


ATACAGGAGG 


6720 


ACAGGTGCAG 


ATAGGACCTG 


CTATGACATT 


TTATAACATA 


GAAAAAATAG 


TAGGAGACAT 


6780 


TAGACAAGCA 


TACTGTAATG 


TCTCTAAAGA 


ACTATGGGAA 


CCAATGTGGA 


ATAGAACAAG 


6840 


AGAGGAAATA 


AAGAAAATCC 


TGGG6AAAAA 


CAACATAACC 


TTCAGGGCTC 


GAGAGAGGAA 


6900 


TGAAGGAGAC 


CTAGAAGTGA 


CACACTTAAT 


GTTCAATTGT 


AGAGGAGAGT 


TTTTCTATTG 


6960 


TAACACTTCC 


AAATTATTTA 


ATGAGGAATT 


ACTTAACGAG 


ACAGGTGAGC 


CTATTACTCT 


7020 


GCCTTGTAGA 


ATAAGACAGA 


TTGTAAATTT 


GTGGACAAGG 


GTAGGAAAAG 


GAATTTATGC 


7080 


ACCACCAATT 


CGGGGAGTTC 


TTAACTGTAC 


CTCCAATATT 


ACTGGACTC3G 


TTCTAGAATA 


7140 


TAGTGGTGGG 


CCTGACACCA 


AGGAAACAAT 


AGTATATCCC 


TCAGGAGGAA 


ACATGGTTAA 


7200 


TCTCTGGAGA 


CAAGAGTTGT 


ATAAGTACAA 


AGTAGTTAGC 


ATAGAACCCA 


TAGGAGTAGC 


7260 


ACCAGGTAAA 


GCTAAAAGAC 


GCACAGTGAG 


TAGAGAAAAA 


AGAGCAGCCT 


TTGGACTAGG 


7320 


TGCGCTGTTT 


CTTGGGTTTC 


TTGGAGCAGC 


AGGGAGCACT 


ATGGGCGCAG 


CGTCAATAAC 


7380 
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GCTGACGGTA CAGGCCCGGA CATTATTATC 
GAGAGCAATA GAGGCGCAAC AACATTTGTT 
CCAGGCAAAA GTCCTTGCTA TAGAAAGATA 
GGGCTGCTCA GGAAAAACAA TATGCTATAC 
CAATACCTCT TATGATACAA TCTGGAATAA 
AAGAAACTAT TCAGGTGTCA TTTTTGGACT 
AAATGAGAAA TCACTCTTGG AATTGGATCA 
TACAAAATGG CTGTGGTATA TAAAAATAGC 
AAGAATCATA AGTATAGTAA TAACTATAAT 
TTCGTTGCAG ACCCTTATCC CAACAGCAAG 
AGGCGTTGGA GAGCAAGACA GAGGCAGATC 
TGTCTGGGAG GACCTCCGGA ACCTGTTGAT 
CTTGATACTG AGGAGGACTC TGGAACTCCT 
ACTGAATGAA CTCAGAACAC ACTTGTGGGG 
GGATAGTGCT ATCAGCTTGC TTAATACAAC 
GATTATAGAA TTAGCACAAA GAATAGGAAG 
ACAAGGCCTA GAAAGAGCAC TGATATAAGA 
TAGGATGGCC AGAAATCAGA GAAAGAATGA 
CAGCAGTAGG AGCAGGAGCA GCTTCTCAAG 
GAAATACTAG .AGACAATAAT GAAAGTATAG 
AAGTAGGCTT TCCAGTACGC CCTCAGGTAC 
TTGATCTTTC CTTCTTTTTA AAAGATAAGG 
AAAGGCAAGA TATTCTAGAC CTCTGGATGT 
ATAACTACAC ACCAGGGCCA GGAATTAGAT 
TAGTACCATT GTCAGCTGAA GAAGTAGAAG 
TACACCCCAT ATGTCAACAT GGAGCAGATG 
TTGACAGCTC CCTAGCAAGA AGACATGTAG 
ACTGCTGACA AGGGACTTTA CTGCTGACAA 
GGACTTTCCA GGGAGGTGTG GTTGGGGGAG 
CCGCTTCTCG CTTGTACTGG GTCTCTCTTG 
GGG 
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TGGGATAGTG 


^1V IV ^1 IV ^^^1V IV 

CAACAGCAGA 


ATATTCTGTT 


7440 


GCAACTCTCA 


ATCTGGGGCA 


fnm IV IV IV IV ^^'ww 


7500 


^^^^^nm n ^^^^^ n m 

CCTTAGGGAT 


CAGCAAATCC 


TAAGTCTATG 


7560 


CACTGTGCCT 


TGGAATGAGA 


CTTGGAGCAA 


7620 


TTTAACCTGG 


IV IV ^ IV V m^i^^^t 

CAACAATGGG 


ATGAGAAAGT 


7680 


1 A 1 AG AAC AG 


GCACAAGAAC 


9V W ^ W ^ 9V IV ^ IV ^ 

AACAGAACAC 


7740 


ATGGGACAGT 


CTGTGGAGCT 


GGTTTGGTAT 


•7 O A 

7800 


TATAATGATA 


GTAGCAGGCA 


TTGTAGGCAT 


7860 


IV ^ IV IV ^ 11 / 1 film 

AGCAAGAGTT 


AGGCAGGGAT 


ATTCTCCCCT 


^7 O O A 

7920 


GGGACCAGAC 


AGGCCAGAAG 


AAACAGAAGG 


A O A 

7980 


CGTGCGATTA 


^rr%^ % ^^^^^^^ IV m 

GTGAGCGGAT 


TCTCAGCTCT 


O A A 

8040 


CTTCCTCTAC 


CACCGCTTGA 


CAGACTCACT 


O i A A 

8100 


GGGACAGAGT 


CTCAGCAGGG 


IV ^fn^/^ IV IV 

GACTGCAACT 


8160 


AATACTTGCA 


TATTGGGGAA 


AAGAGTTAAG 


O O O A 

8220 


AGCTATTGTA 


GTAGCAGAAG 


GAACAGATAG 


8280 


GGGAATATTA 


CACATACCTA 


GAAGAATCAG 


8340 


TGGGAAAGAT 


TTGGTCAAAG 


AGCAGCCTAG 


O Jl AA 

8400 


GAAGACAAAC 


GCAAGAACCA 


TV TV Tk 

GCAGTAGAGC 


8460 


ATCTAGCTAA 


TCGAGGGGCC 


Tk TV TV m TV TV 

ATCACCATAA 


8520 


CTTGGCTAGA 


IV IV IV 9V ^1V IV 

AGCACAAGAA 


^ TV TV /** TV TV TV 

GAAGAAGAGG 


O C O A 

8580 


CATTAAGGCC 


« 4v miv IV ^^wjmv m 

AATAACCTAT 


TV IV TV ^TV^^^mm 

AAACAGGCTT 


8640 


^^^^^^^ IV ^WV^^"* « 

GGGGACTGGA 


AGGGCTAGTT 


»W/^/'<m^^TV ^IV TV 

TGGTCCAGAA 


8700 


ATCACACACA 


% ^^^^^^^ fTC^^^^m^^ 

AGGCATCCTC 


CCTGACTGGC 


O t f A 

8760 


ACCCCGTAAC 


CTTTGGATGG 


nri^/ iiiuii^^ TV TV TV ^ 

TGCTTCAAAC 


O O O A 

8820 


AGGCTAATGA 


« ^^^^ H IV IV IV 

AGGAGACAAC 


TV TV fT<^/^^/^IH/'*m 

AATGCCCTCT 


O O O A 

8880 


ATGATCATAA 


AGAAGTGTTG 


G X G i\.9Gv.GA 1 




CAAGAGAGCT 


GCATCCGGAG 


TTTTACAAGA 


9000 


GGGACTTTAT 


ACTTGGGGAC 


TTTCCGCCAG 


9060 


TGGCTTGCCC 


TCAGAGCTGC 


ATAAAAGCAG 


9120 


CTGGACCAGA 


TTAGAGTCTG 


GGAGCATATT 


9180 
9183 
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(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 813 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN (genomigue) 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 



TTGGAAGGGC 


TAGTTTGGTC 


CAGAAAAAGG 


CAAGATATTC 


TAGACCTCTG 


GATGTATCAC 


ou 


ACACAAGGCA 


TCCTCCCTGA 


CTGGCATAAC 


TACACACCAG 


GGCCAGGAAT 


m 71 It tT\ TV ^^^^^ 

TAGATACCCC 


1 O A 


GTAACCTTTG 


GATGGTGCTT 


CAAACTAGTA 


CCATTGTCAG 


CTGAAGAAGT 


AGAAGAGGCT 


1 O A 

loO 


AATGAAGGAG 


ACAACAATGC 


CCTCTTACAC 


CCCATATGTC 


AACATGGAGC 


AGATGATGAT 


24U 


CATAAAGAAG 


TGTTGGTGTG 


GCGATTTGAC 


AGCTCCCTAG 


CAAGAAGACA 


TGTAGCAAGA 




GAGCTGCATC 


CGGAGTTTTA 


CAAGAACTGC 


TGACAAGGGA 


CTTTACTGCT 


GACAAGGGAC 


360 


TTTATACTTG 


GGGACTTTCC 


GCCAGGGACT 


TTCCAGGGAG 


GTGTGGTTGG 


GGGAGTGGCT 


420 


TGCCCTCAGA 


GCTGCATAAA 


AGCAGCCGCT 


TCTCGCTTGT 


ACTGGGTCTC 


TCTTGCTGGA 


480 


CTATACAGAT 


TAGAGCCTGG 


GAGCTCTCTG 


GCTAGCAGGG 


AACCCACTGfC 


TTAAGCCTCA 


540 


ATAAATACAG 


CTTGCCTTGA 


GTGCTAAAGT 


GGTGTGTGCC 


CATCCATTCG 


GTAACTCTGG 


600 


TACCTAGAGA 


ATCCCTCAGA 


CCATCTAGAC 


TGAGTGAAAA 


ATCTCTAGCA 


GTGGCGCCCG 


660 


AACAGGGACT 


TAGTTGAAAA 


CGAAAGTAGA 


ACCGGAGGCT 


GAATCTCTCG 


ACGCAGGACT 


720 


CGGCTCGTTG 


GTGCACACAG 


CGAGAGGCGA 


GGCGGCGGAA 


GTGTGAGTAC 


GCAATTTTGA 


780 


CTGGCGGTGG 


CCAGAAAGTA 


GGAGAGAGGG 


AGG 






813 


(2) INFORMATIONS POUR 


LA SEQ ID NO: 3: 









(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1539 paires de bases 

(B) TYPE; nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .1536 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

ATG GGT GCG AGA GCG TCA GTG TTA ACA GGG GGA AAA TTA GAT CAA TGG 48 
Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gin Trp 
15 10 15 

GAA TCA ATT TAT TTG AGA CCA GGG GGA AAG AAA AAA TAC AGA ATG AAA 96 
Glu Ser lie Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 
20 25 .30 
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CAT TTA GTA TGG GCA AGC AGG GAG CTG GAA AGA TTC GCT TGT AAC CCA 144 
His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 
35 40 45 

GGT CTC ATG GAC AC A GCG GAC GGC TGT GCC AAG TTA CTA AAT CAA TTA 192 
Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gin Leu 
50 55 60 

GAA CCA GCT CTC AAG ACA GGG TCA GAA GAA CTG CGC TCT TTA TAT AAC 240 
Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 
65 70 75 80 

GCT CTA GCA GTT CTT TAT TGT GTC CAT AGT AGG ATA CAG ATA CAC AAC 288 
Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg lie Gin He His Asn 
85 90 95 

ACA CAG GAA GCT TTG GAC AAG ATA AAA GAG AAA CAG GAA CAG CAC AAG 336 
Thr Gin Glu Ala Leu Asp Lys He Lys Glu Lys Gin Glu Gin His Lys 
100 105 110 

CCC GAG CCA AAA AAC CCA GAA GCA GGG GCA GCG GCA GCA ACT GAT AGC 384 
Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 
115 120 125 

AAT ATC AGT AGG AAT TAT CCT CTA GTC CAG ACT GCT CAA GGA CAA ATG 432 
Asn He Ser Arg Asn Tyr Pro Leu Val Gin Thr Ala Gin Gly Gin Met 
130 135 140 

GTA CAT CAG CCG CTG ACA CCC AGA ACC TTA AAT GCT TGG GTG AAA GTG 480 
Val His Gin Pro Leu Thr Pro Arg Thr Leu Asn Ala Trp Val Lys Val 
145 150 155 160 

ATA GAG GAG AAG GCC TTT AGT CCA GAA GTA ATA CCA ATG TTT ATG GCC 528 
He Glu Glu Lys Ala Phe Ser Pro Glu Val He Pro Met Phe Met Ala 
165 170 175 

TTG TCA GAA GGG GCA ACG CCC TCA GAT CTA AAT ACT ATG TTA AAT ACA 576 
Leu Ser Glu Gly Ala Thr Pro Ser Asp Leu Asn Thr Met Leu Asn Thr 
180 185 190 

GTA GGG GGA CAT CAG GCA GCA ATG CAG ATG CTG AAG GAA GTC ATC AAT 624 
Val Gly Gly His Gin Ala Ala Met Gin Met Leu Lys Glu Val He Asn 
195 200 205 

GAG GAA GCA GCA GAC TGG GAT AGG ACA CAT CCA GTC CCT GTG GGA CCA 672 
Glu Glu Ala Ala Asp Trp Asp Arg Thr His Pro Val Pro Val Gly Pro 
210 215 220 

CTA CCC CCA GGG CAA CTG AGA GAC CCT AGA GGA AGT GAT ATA GCA GGA 720 
Leu Pro Pro Gly Gin Leu Arg Asp Pro Arg Gly Ser Asp He Ala Gly 
225 230 235 240 

ACA ACT AGC ACC CTG GCA GAA CAG GTG GCT TGG ATG ACT GCT AAT CCT 768 
Thr Thr Ser Thr Leu Ala Glu Gin Val Ala Trp Met Thr Ala Asn Pro 
245 250 255 

CCT GTT CCA GTA GGA GAT ATT TAT AGA AGA TGG ATA GTC CTG GGG TTA 816 
Pro Val Pro Val Gly Asp He Tyr Arg Arg Trp He Val Leu Gly Leu 
260 265 270 

AAC AGA ATT GTG AGA ATG TAT AGT CCT GTC AGC ATT CTA GAG ATC AAA 864 
Asn Arg He Val Arg Met Tyr Ser Pro Val Ser He Leu Glu He Lys . 
275 280 285 
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CAA GGA CCA AAA GAA CCC TTC AGA GAC TAT GTA GAC AGG TTC TAC AAA 912 
Gin Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys 
290 295 300 

ACT CTA AGA GCA GAG CAG GCA ACA CAG GAA GTA AAG AAT TGG ATG ACA 960 
Thr Leu Arg Ala Glu Gin Ala Thr Gin Glu Val Lys Asn Trp Met Thr 
305 310 315 320 

GAA ACA CTC TTA GTA CAA AAT GCA AAC CCA GAT TGT AAA CAG CTC CTA 1008 
Glu Thr Leu Leu Val Gin Asn Ala Asn Pro Asp Cys Lys Gin Leu Leu 
325 330 335 

AAA GCA TTA GGG CCA GGA GCT ACC TTA GAA GAG ATG ATG ACG GCC TGC 1056 
Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys 
340 345 350 

CAG GGA GTG GGG GGA CCA GCA CAT AAG GCA AGA GTG CTA GCA GAG GCT 1104 
Gin Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala 
355 360 365 

ATG TCA CAG GTG CAG CAG CCA ACA ACT AGT GTC TTT GCA CAA AGG GGA 1152 
Met Ser Gin Val Gin Gin Pro Thr Thr Ser Val Phe Ala Gin Arg Gly 
. 370 375 380 

AAC TTT AAA GGC ATA AGG AAA CCC ATT AAA TGT TTC AAT TGT GGC AAA 1200 
Asn Phe Lys Gly lie Arg Lys Pro lie Lys Cys Phe Asn Cys Gly Lys 
385 390 395 400 

GAG GGC CAT TTG GCA AGA AAC TGT AAG GCC CCT AGA AGA GGA GGC TGT 1248 
Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys 
405 410 415 

TGG AAG TGT GGG CAA GAA GGA CAT CAA ATG AAA GAT TGT AAA AAT GAA 1296 
Trp Lys Cys Gly Gin Glu Gly His Gin Met Lys Asp Cys Lys Asn Glu 
420 425 430 

GGA AGA CAG GCT AAT TTT TTA GGG AAG AGC TGG TCT CCC TTC AAA GGG 1344 
Gly Arg Gin Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly 
435 440 445 

AGA CCA GGA AAC TTC CCC CAG ACA ACA ACA AGG AAA GAG CCC ACA GCC 1392 
Arg Pro Gly Asn Phe Pro Gin Thr Thr Thr Arg Lys Glu Pro Thr Ala 
450 455 460 

CCG CCA CTA GAG AGT TAT GGG TTT CAG GAG GAG AAG AGC ACA CAG GGG 1440 
Pro Pro Leu Glu Ser Tyr Gly Phe Gin Glu Glu Lys Ser Thr Gin Gly 
465 470 475 480 

AAG GAG ATG CAG GAG AAC CAG GAG AGG ACA GAG AAC TCT CTG TAC CCA 1488 
Lys Glu Met Gin Glu Asn Gin Glu Arg Thr Glu Asn Ser Leu Tyr Pro 
485 490 495 

CCT TTA ACT TCC CTC AGA TCA CTC TTT GGC AAC GAC CCG TCA TCA CAG 1536 
Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gin 
500 505 510 

TAA 1539 



(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 512 acides amines 
(6) TYPE: acide amine 
(D) CONFIGURATION: lin^aire 
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(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gin Trp 
15 10 15 

Glu Ser lie Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 
20 25 30 

His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 
35 40 45 

Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gin Leu 
50 55 60 

Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 
65 70 75 80 

Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg lie Gin lie His Asn 
85 90 95 

Thr Gin Glu Ala Leu Asp Lys lie Lys Glu Lys Gin Glu Gin His Lys 
100 105 110 

Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 
115 120 . 125 

Asn lie Ser Arg Asn Tyr Pro Leu Val Gin Thr Ala Gin Gly Gin Met 
130 135 140 

Val His Gin Pro Leu Thr Pro Arg Thr Leu Asn Ala Trp Val Lys Val 
145 150 155 160 

He Glu Glu Lys Ala Phe Ser Pro Glu Val He Pro Met Phe Met Ala 
165 170 175 

Leu Ser Glu Gly Ala Thr Pro Ser Asp Leu Asn Thr Met Leu Asn Thr 
180 185 190 

Val Gly Gly His Gin Ala Ala Met Gin Met Leu Lys Glu Val He Asn 
195 200 205 

Glu Glu Ala Ala Asp Trp Asp Arg Thr His Pro Val Pro Val Gly Pro 
210 215 220 

Leu Pro Pro Gly Gin Leu Arg Asp Pro Arg Gly Ser Asp He Ala Gly 
225 230 235 240 

Thr Thr Ser Thr Leu Ala Glu Gin Val Ala Trp Met Thr Ala Asn Pro 
245 250 255 

Pro Val Pro Val Gly Asp He Tyr Arg Arg Trp He Val Leu Gly Leu 
260 265 270 

Asn Arg He Val Arg Met Tyr Ser Pro Val Ser He Leu Glu He Lys 
275 280 285 

Gin Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys 
290 295 300 

Thr Leu Arg Ala Glu Gin Ala Thr Gin Glu Val Lys Asn Trp Met Thr 
305 310 315 320 

Glu Thr Leu Leu Val Gin Asn Ala Asn Pro Asp Cys Lys Gin Leu Leu 
325 330 335 
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Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys 
340 345 350 

Gin Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala 
355 360 365 

Met Ser Gin Val Gin Gin Pro Thr Thr Ser Val Phe Ala Gin Arg Gly 
370 375 380 

Asn Phe Lys Gly lie Arg Lys Pro lie Lys Cys Phe Asn Cys Gly Lys 
385 390 395 400 

Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys 
405 410 415 

Trp Lys Cys Gly Gin Glu Gly His Gin Met Lys Asp Cys Lys Asn Glu 
420 425 430 

Gly Arg Gin Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly 
435 440 445 

Arg Pro Gly Asn Phe Pro Gin Thr Thr Thr Arg Lys Glu Pro Thr Ala 
450 455 460 

Pro Pro Leu Glu Ser Tyr Gly Phe Gin Glu Glu Lys Ser Thr Gin Gly 
465 470 475 480 

Lys Glu Met Gin Glu Asn Gin Glu Arg Thr Glu Asn Ser Leu Tyr Pro 
485 490 495 



Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gin 
500 505 510 



(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3045 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .3042 



(xi) DESCRIPTION DE 



CCC CCA GAC AAC AAC AAG 
Pro Pro Asp Asn Asn Lys 
530 

TTA TGG GTT TCA GGA GGA 
Leu Trp Val Ser Gly Gly 
545 550 



LA SEQUENCE: SEQ ID NO: 

GAG 
Glu 



GAA AGA GCC CAC AGC CCC 
Glu Arg Ala His Ser Pro 
535 540 

GAA GAG CAC ACA GGG GAA 
Glu Glu His Thr Gly Glu 
555 



5: 

ACC AGG AAA CTT 48 

Thr Arg Lys Leu 

525 

GCC ACT AGA GAG 96 
Ala Thr Arg Glu 



GGA GAT GCA GGA 144 
Gly Asp Ala Gly 
560 



TTT TTT AGG GAA GAG CTG GTC TCC CTT CAA AGG 
Phe Phe Arg Glu Glu Leu Val Ser Leu Gin Arg 
515 520 
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GAA CCA GGA GAG GAC AGA GAA CTC TCT GTA CCC ACC TTT AAC TTC CCT 
Glu Pro GLy Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro 
565 570 575 



192 



GAG ATC ACT CTT TGG CAA CGA CCC GTC ATC ACA GTA AAA ATA GGG AAA 
Gin He Thr Leu Trp Gin Arg Pro Val He Thr Val Lys He Gly Lys 
580 585 590 



240 



GAA GTA AGA GAA GCT* CTT TTA GAT ACA GGA GCT GAT GAT ACA GTA ATA 
Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val He 
595 . 600 605 



288 



GAA GAG CTA CAA TTA GAG GGA AAA TGG AAA CCA AAA ATG ATA GGA GGA 
Glu Glu Leu Gin Leu Glu Gly Lys Trp Lys Pro Lys Met He Gly Gly 
610 615 620 



336 



ATT GGA GGA TTT ATC AAA GTG AGA CAA TAT GAT AAT ATA ACA GTA GAC 
He Gly Gly Phe He Lys Val Arg Gin Tyr Asp Asn He Thr Val Asp 
625 630 635 640 



384 



ATA CAG GGA AGA AAA GCA GTT GGT ACA GTA TTA GTA GGA CCA ACA CCT 
He Gin Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro 
645 650 655 



432 



GTT AAT ATT ATA GGA AGA AAT CTT TTA ACC CAG ATT GGC TGT ACT TTA 
Val Asn He He Gly Arg Asn Leu Leu Thr Gin He Gly Cys Thr Leu 
660 665 670 



480 



AAT TTT CCA ATA AGT CCT ATT GAA ACT GTA CCA GTA AAA TTA AAA CCA 
Asn Phe Pro He Ser Pro He Glu Thr Val Pro Val Lys Leu Lys Pro 
675 680 685 



528 



GGA ATG GAT GGC CCA AAG GTA AAA CAA TGG CCT TTG ACA ACA GAA AAA 
Gly Met Asp Gly Pro Lys Val Lys Gin Trp Pro Leu Thr Thr Glu Lys 
690 695 700 



576 



ATA GAG GCA TTA AGA GAA ATT TGT ACA GAA ATG GAA AAG GAA GGA AAA 
He Glu Ala Leu Arg Glu He Cys Thr Glu Met Glu Lys Glu Gly Lys 
705 710 715 720 



624 



ATT TCT AGA ATA GGG CCT GAG AAT CCA TAT AAC ACT CCA ATT TTT GCT. 
He Ser Arg He Gly Pro Glu Asn Pro Tyr Asn Thr Pro He Phe Ala 
725 730 735 



672 



ATA AAA AAG AAA GAT AGC ACT AAA TGG AGA AAA TTA GTA GAT TTC AGG 
He Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg 
740 745 750 



720 



GAA TTA AAT AAA AGG ACC CAA GAT TTT TGG GAA GTG CAG CTA GGA ATT 
Glu Leu Asn Lys Arg Thr Gin Asp Phe Trp Glu Val Gin Leu Gly He 
755 760 765 



768 



CCA CAT CCA GCA GGA TTA AAG CAG AAA AAA TCA GTG ACA GTT TTG GAT 
Pro His Pro Ala Gly Leu Lys Gin Lys Lys Ser Val Thr Val Leu Asp 
770 775 780 



816 



GTA GGA GAT GCT TAT TTT TCA TGT CCC TTG GAC AAA GAT TTT AGA AAG 
Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys 
785 790 795 800 



864 



TAT ACA GCT TTT ACC ATA CCT AGT ATA AAC AAT GAG ACA CCT GGT ATT 
Tyr Thr Ala Phe Thr He Pro Ser He Asn Asn Glu Thr Pro Gly He 
805 810 815 



912 
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AGA TAC CAG TAT AAT GTG CTG CCA CAA GGC TGG AAA GGG TCA CCA GCA 960 
Arg Tyr Gin Tyr Asn Val Leu Pro Gin Gly Trp Lys Gly Ser Pro Ala 
820 825 830 

ATT TTT CAG AGT ACA ATG ACA AAA ATT CTA GAA CCA TTC AGA GAG AAA 1008 
lie Phe Gin Ser Thr Met Thr Lys lie Leu Glu Pro Phe Arg Glu Lys 
835 840 845 

CAT CCA GAG ATA ATC ATT TAC CAG TAC ATG GAT GAC CTC TAT GTG GGA 1056 
His Pro Glu lie lie lie Tyr Gin Tyr Met Asp Asp Leu Tyr Val Gly 
850 855 860 

TCT GAC TTA GAA CTA GCA CAA CAT AGA GAG GCA GTA GAA GAC CTC AGA 1104 
Ser Asp Leu Glu Leu Ala Gin His Arg Glu Ala Val Glu Asp Leu Arg 
865 870 875 880 

GAT CAT CTT TTG AAG TGG GGC TTT ACG ACC CCT GAC AAA AAA CAT CAG 1152 
Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gin 
885 890 895 

AAG GAG CCC CCG TTC CTC TGG ATG GGA TAT GAA CTC CAT CCA GAC AAA 1200 
Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys 
900 905 910 

TGG ACA GTC CAG CCA ATA AAG TTA CCA GAA AAG GAT GTA TGG ACT GTC 1248 
Trp Thr Val Gin Pro lie Lys Leu Pro Glu Lys Asp Val Trp Thr Val 
915 920 925 

AAT GAT ATA CAG AAA TTA GTA GGA AAG TTA AAT TGG GCA AGT CAG ATC 1296 
Asn Asp lie Gin Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gin lie 
930 935 940 

TAT CCA GGA ATC AGA GTA AAA CAG CTC TGT AAA TTA ATC AGA GGA GCC 1344 
Tyr Pro Gly lie Arg Val Lys Gin Leu Cys Lys Leu lie Arg Gly Ala 
945 950 955 960 

AGA GCT TTG ACA GAA GTA GTC AAC TTT ACA GAA GAA GCA GAA TTA GAA 1392 
Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu 
965 970 975 

CTA GCA GAA AAC AGG GAG ATA TTA AAA GAA CCC CTG CAT GGA GTC TAT. 1440 
Leu Ala Glu Asn Arg Glu lie Leu Lys Glu Pro Leu His Gly Val Tyr 
980 985 990 

TAT GAC CCA GGA AAA GAA TTA GTA GCA GAA ATT CAA AAG CAA GGA CAA 1488 
Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu lie Gin Lys Gin Gly Gin 
995 1000 1005 

GGT CAG TGG ACA TAT CAG ATT TAT CAG GAG TTA CAT AAA AAT TTA AAA 1536 
Gly Gin Trp Thr Tyr Gin lie Tyr Gin Glu Leu His Lys Asn Leu Lys 
1010 1015 1020 

ACA GGA AAG TAT GCA AAA ATG AGA TCT GCC CAT ACT AAT GAT ATA AAA 1584 
Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp lie Lys 
1025 1030 1035 1040 

CAG TTA GTT GAA GTG GTA AGG AAA GTG GCA ACA GAA AGT ATA GTA ATT 1632 
Gin Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser lie Val He . 

1045 1050 1055 

TGG GGA AAG ACT CCT AAA TTT AGA TTA CCA GTA CAA AAG GAA GTG TGG 1680 
Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gin Lys Glu Val Trp 
1060 1065 1070 
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GAG GCA TOG TOG ACC GAT CAT TGG CAA GCA ACT TGG ATT CCT GAG TGG 
Glu Ala Trp Trp Thr Asp His Trp Gin Ala Thr Trp He Pro Glu Trp 
1075 1080 1085 



1728 



GAA TTT GTC AAC ACT CCT CCC CTT GTA AAA TTA TGG TAT CAG TTA GAA 
Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gin Leu Glu 
1090 1095 1100 



1776 



ACA GAG CCA ATC AGT GGG GCA GAA ACT TTC TAT GTA GAT GGA GCA GCT 
Thr Glu Pro He Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala 
1105 1110 1115 1120 



1824 



AAT AGG GAA ACA AAA TTG GGA AAA GCA GGT TTT GTG ACA GAT AGG GGA 
Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly 
1125 1130 1135 



1872 



AGA CAG AAA GTG GTC TCT ATT GCA GAC ACC ACC AAT CAA AAG GCT GAG 
Arg Gin Lys Val Val Ser He Ala Asp Thr Thr Asn Gin Lys Ala Glu 
1140 1145 1150 



1920 



TTA CAA GCT ATC CTT ATG GCC TTA CAA GAG TCA GGA CGG GAT GTA AAC 
Leu Gin Ala He Leu Met Ala Leu Gin Glu Ser Gly Arg Asp Val Asn 
1155 1160 1165 



1968 



ATA GTC ACT GAC TCT CAG TAT GCT ATG GGA ATA ATT CAT TCA CAG CCA 
He Val Thr Asp Ser Gin Tyr Ala Met Gly He He His Ser Gin Pro 
1170 1175 1180 



2016 



GAT AAA AGT GAA TCA GAA TTG GTG AGC CAA ATA ATA GAA GAG CTC ATA 
Asp Lys Ser Glu Ser Glu Leu Val Ser Gin He He Glu Glu Leu He 
1185 1190 1195 1200 



2064 



AAA AAG GAA AGA GTT TAT CTC TCT TGG GTA CCT GCA CAT AAA GGT ATT 
Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly He 
1205 1210 1215 



2112 



GGA GGA AAT GAG CAG GTA GAC AAA TTA GTT AGC TCA GGA ATT AGA AAA 
Gly Gly Asn Glu Gin Val Asp Lys Leu Val Ser Ser Gly He Arg Lys 
1220 1225 1230 



2160 



ATA TTA TTC CTA GAT GGT ATA GAA AAA GCC CAA GAA GAT CAT GAC AGA 
He Leu Phe Leu Asp Gly He Glu Lys Ala Gin Glu Asp His Asp Arg 
1235 1240 1245 



2208 



TAT CAC AGC AAT TGG AAA GCA ATG GCC AGT GAT TTT AAC - TTA CCC CCC 
Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro 
1250 1255 1260 



2256 



ATA GTG GCA AAA GAA ATA GTA GCC AGC TGT GAC AAA TGC CAG CTA AAA 
He Val Ala Lys Glu He Val Ala Ser Cys Asp Lys Cys Gin Leu Lys 
1265 1270 1275 1280 



2304 



GGG GAA GCC ATG CAT GGA CAG GTC AAT TGT AGT CCA GGA GTG TGG CAA 
Gly Glu Ala Met His Gly Gin Val Asn Cys Ser Pro Gly Val Trp Gin 
1285 1290 1295 



2352 



TTA GAT TGT ACA CAC TTA GAG GGA AAA ATC ATC CTT GTG GCG GTC CAT 
Leu Asp Cys Thr His Leu Glu Gly Lys He He Leu Val Ala Val His 
1300 1305 1310 



2400 



GTG GCC AGT GGC TAG TTA GAA GCA GAA GTT ATT CCT GCA GAG ACA GGA 
Val Ala Ser Gly Tyr Leu Glu Ala Glu Val He Pro Ala Glu Thr Gly 
1315 1320 1325 



2448 
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CAG GAA ACA GCA TAT TTT ATT TTA AAG TTA GCT GGA AGA TGG CCA GTA 
Gin Glu Thr Ala Tyr Phe lie Leu Lys Leu Ala Gly Arg Trp Pro Val 
1330 1335 1340 



2496 



AAA GTT ATA CAC ACT GAT AAT GGA TCC AAT TTC ACT AGT GCC ACT GTA 
Lys Val lie His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val 
1345 1350 1355 1360 



2544 



AAA GCA GCC TGT TGG TGG GCA AAT ATC AAA CAG GAA TTT GGG ATA CCC 
Lys Ala Ala Cys Trp Trp Ala Asn lie Lys Gin Glu Phe Gly lie Pro 
1365 1370 1375 



2592 



TAC AAT CCT CAA AGT CAG GGA GCA GTA GAG TCC ATG AAT AAA GAA TTA 
Tyr Asn Pro Gin Ser Gin Gly Ala Val Glu Ser Met Asn Lys Glu Leu 
1380 1385 1390 



2640 



AAG AAA ATT ATA GGA CAA ATC AGA GAT CAA GCA GAA CAT CTA AAG ACA 
Lys Lys lie lie Gly Gin lie Arg Asp Gin Ala Glu His Leu Lys Thr 
1395 1400 1405 



2688 



GCA GTG CAA ATG GCG GTT TTC ATT CAC AAT TTT AAA AGA AAA GGG GGG 
Ala Val Gin Met Ala Val Phe He His Asn Phe Lys Arg Lys Gly Gly 
1410 1415 1420 



2736 



ATT GGG GGG TAC ACT GCA GGG GAA AGA ATA ATA GAC ATA ATA GCA ACA 
He Gly Gly Tyr Thr Ala Gly Glu Arg He He Asp He He Ala Thr 
1425 1430 1435 1440 



2784 



GAC ATA CAG ACA ACA AAT TTA CAA ACA CAA ATT TTA AAA GTT CAA AAT 
Asp He Gin Thr Thr Asn Leu Gin Thr Gin He Leu Lys Val Gin Asn 
1445 1450 1455 



2832 



TTT CGG GTT TAT TAC AGA GAC AGC AGA GAT CCC ATT TGG AAA GGA CCA 
Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro He Trp Lys Gly Pro 
1460 1465 1470 



2880 



GCC AAA CTT CTG TGG AAA GGA GAA GGG GCA GTG GTA ATT CAA GAT AAC 
Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val He Gin Asp Asn 
1475 1480 1485. 



2928 



GGG GAT ATA AAA GTA GTC CCA CGT AGG AAA GCA AAA ATA ATT AGG GAT. 
Gly Asp He Lys Val Val Pro Arg Arg Lys Ala Lys He He Arg Asp 
1490 1495 1500 



2976 



TAT GGA AAA CAG ATG GCA GGT GAT GGT TGT GTG GCA AGT GGA CAG GAT 
Tyr Gly Lys Gin Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gin Asp 
1505 1510 1515 1520 



3024 



GAA AAT CAG GAA ATG GAA TAG 
Glu Asn Gin Glu Met Glu 
1525 



3045 



(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1014 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 



Phe Phe Arg Glu Glu Leu Val Ser Leu Gin Arg Glu Thr Arg Lys Leu 
1 5 10 15 
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Pro Pro Asp Asn Asn Lys Glu Arg Ala His Ser Pro Ala Thr Arg Glu 
20 25 30 

Leu Trp Val Ser Gly Gly Glu Glu His Thr Gly Glu Gly Asp Ala Gly 
35 40 45 

Glu Pro Gly Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro 
50 55 60 

Gin lie Thr Leu Trp Gin Arg Pro Val lie Thr Val Lys lie Gly Lys 
65 70 75 80 

Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val lie 
85 90 95 

Glu Glu Leu Gin Leu Glu Gly Lys Trp Lys Pro Lys Met lie Gly Gly 
100 105 110 

lie Gly Gly Phe lie Lys Val Arg Gin Tyr Asp Asn lie Thr Val Asp 
115 120 125 

He Gin Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro 
130 135 140 

Val Asn He He Gly Arg Asn Leu Leu Thr Gin He Gly Cys Thr Leu 
145 150 155 160 

Asn Phe Pro He Ser Pro He Glu Thr Val Pro Val Lys Leu Lys Pro 
165 170 175 

Gly Met Asp Gly Pro Lys Val Lys Gin Trp Pro Leu Thr Thr Glu Lys 
180 185 190 

He Glu Ala Leu Arg Glu He Cys Thr Glu Met Glu Lys Glu Gly Lys 
195 200 205 

He Ser Arg He Gly Pro Glu Asn Pro Tyr Asn Thr Pro He Phe Ala 
210 215 220 

He Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg 
225 230 235 240. 

Glu Leu Asn Lys Arg Thr Gin Asp Phe Trp Glu Val Gin Leu Gly He 
245 250 255 

Pro His Pro Ala Gly Leu Lys Gin Lys Lys Ser Val Thr Val Leu Asp 
260 265 270 

Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys 
275 280 285 

Tyr Thr Ala Phe Thr He Pro Ser He Asn Asn Glu Thr Pro Gly He 
290 295 300 

Arg Tyr Gin Tyr Asn Val Leu Pro Gin Gly Trp Lys Gly Ser Pro Ala 
305 310 315 320 

He Phe Gin Ser Thr Met Thr Lys He Leu Glu Pro Phe Arg Glu Lys 
325 330 335 

His Pro Glu He He He Tyr Gin Tyr Met Asp Asp Leu Tyr Val Gly 
340 345 350 



Ser Asp Leu Glu Leu Ala Gin His Arg Glu Ala Val Glu Asp Leu Arg 
355 360 365 
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Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gin 
370 375 380 

Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys 
385 390 395 400 

Trp Thr Val Gin Pro He Lys Leu Pro Glu Lys Asp Val Trp Thr Val 
405 410 415 

Asn Asp He Gin Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gin He 
420 425 430 

Tyr Pro Gly He Arg Val Lys Gin Leu Cys Lys Leu He Arg Gly Ala 
435 440 445 

Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu 
450 455 460 

Leu Ala Glu Asn Arg Glu He Leu Lys Glu Pro Leu His Gly Val Tyr 
465 470 475 480 

Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu He Gin Lys Gin Gly Gin 
485 490 495 

Gly Gin Trp Thr Tyr Gin He Tyr Gin Glu Leu His Lys Asn Leu Lys 
500 505 510 

Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp He Lys 

515 520 525 

Gin Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser He Val He 
530 535 540 

Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gin Lys Glu Val Trp 
545 550 555 560 

Glu Ala Trp Trp Thr Asp His Trp Gin Ala Thr Trp He Pro Glu Trp 

565 570 575 

Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gin Leu Glu 
580 585 590 

Thr Glu Pro He Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala 
595 600 605 

Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly 

610 615 620 

Arg Gin Lys Val Val Ser He Ala Asp Thr Thr Asn Gin Lys Ala Glu 
625 630 635 640 

Leu Gin Ala He Leu Met Ala Leu Gin Glu Ser Gly Arg Asp Val Asn 
645 650 655 

He Val Thr Asp Ser Gin Tyr Ala Met Gly He He His Ser Gin Pro 
660 665 670 

Asp Lys Ser Glu Ser Glu Leu Val Ser Gin He He Glu Glu Leu He 
675 680 685 

Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly He 
690 695 700 



Gly Gly Asn Glu Gin Val Asp Lys Leu Val Ser Ser Gly He Arg Lys 
705 710 715 720 
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lie Leu Phe Leu Asp Gly lie Glu Lys Ala Gin Glu Asp His Asp Arg 
725 730 735 

Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro 
740 745 750 

lie Val Ala Lys Glu lie Val Ala Ser Cys Asp Lys Cys Gin Leu Lys 
755 760 765 

Gly Glu Ala Met His Gly Gin Val Asn Cys Ser Pro Gly Val Trp Gin 
770 775 780 

Leu Asp Cys Thr His Leu Glu Gly Lys lie lie Leu Val Ala Val His 
785 790 795 800 

Val Ala Ser Gly Tyr Leu Glu Ala Glu Val lie Pro Ala Glu Thr Gly 
805 810 815 

Gin Glu Thr Ala Tyr Phe lie Leu Lys Leu Ala Gly Arg Trp Pro Val 
820 825 830 

Lys Val lie His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val 
835 840 845 

Lys Ala Ala Cys Trp Trp Ala Asn lie Lys Gin Glu Phe Gly lie Pro 
850 855 860 

Tyr Asn Pro Gin Ser Gin Gly Ala Val Glu Ser Met Asn Lys Glu Leu 
865 870 875 880 

Lys Lys lie lie Gly Gin lie Arg Asp Gin Ala Glu His Leu Lys Thr 
885 890 895 

Ala Val Gin Met Ala Val Phe He His Asn Phe Lys Arg Lys Gly Gly 
900 905 910 

He Gly Gly Tyr Thr Ala Gly Glu Arg He lie Asp He He Ala Thr 
915 920 925 

Asp He Gin Thr Thr Asn Leu Gin Thr Gin He Leu Lys Val Gin Asn 
930 935 940 

Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro He Trp Lys Gly Pro 
945 950 955 960 

Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val He Gin Asp Asn 
965 970 975 

Gly Asp He Lys Val Val Pro Arg Arg Lys Ala Lys He He Arg Asp 
980 985 990 

Tyr Gly Lys Gin Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gin Asp 
995 1000 1005 

Glu Asn Gin Glu Met Glu 
1010 

(2) INFORMATIONS POUR LA SEQ ID NO : 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 579 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .576 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

ATG GAA AAC AGA TGG CAG GTG ATG GTT GTG TGG CAA GTG GAC AGG ATG 
Met Glu Asn Arg Trp Gin Val Met Val Val Trp Gin Val Asp Arg Met 
1015 1020 1025 1030 



48 



AAA ATC AGG AAA TGG AAT AGC TTA GTA AAA CAT CAT ATG TAT GTG TCA 
Lys lie Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser 
1035 1040 1045 



96 



AAA AAG GCA AAA GGA TGG TAT TAT AGA CAT CAT TAT GAA ACA CAT CAC 
Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His 
1050 1055 1060 



144 



CCA AAA ATA AGT TCA GAA GTA CAT ATC CCA GTA GGT CAG GCA AGA TTA 
Pro Lys He Ser Ser Glu Val His He Pro Val Gly Gin Ala Arg Leu 
1065 1070 1075 



192 



GTG ACA GTC ACT TAT TGG GGG CTA ACA ACA GGA GAA CAG TCT TGG CAT 
Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gin Ser Trp His 
1080 1085 1090 



240 



CTA GGA CAT GGA GTA TCC ATA GAA TGG AGA CTA AGA AAA TAC AAG ACA 
Leu Gly His Gly Val Ser He Glu Trp Arg Leu Arg Lys Tyr Lys Thr 
1095 1100 1105 1110 



288 



CAA GTT GAT CCT GAA ATG GCA GAC AAG CTA ATA CAT CTT CAT TAT TTT 
Gin Val Asp Pro Glu Met Ala Asp Lys Leu lie His Leu His Tyr Phe 
1115 1120 1125 



336 



GAT TGT TTT ACA GCC TCT GCC ATA AGG CAA GCG GTC TTA GGG AGA CCA 
Asp Cys Phe Thr Ala Ser Ala He Arg Gin Ala Val Leu Gly Arg Pro 
1130 1135 1140 



384 



GTA TTA CCT AGG TGT GAA TAT CCA GCA GGG CAC AAA CAG GTA GGC ACC 
Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gin Val Gly Thr 
1145 1150 1155 



432 



CTA CAA TAT CTA GCA CTA ACA GCC TGG GTG GGA GCA AAG AAG AGA AAG 
Leu Gin Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys 
1160 1165 1170 



480 



CCA CCC TTA CCT AGT GTG ACT AAG CTA ACA GAA GAT AGA TGG AAC GAG 
Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu 
1175 1180 1185 1190 



528 



CAC CAG AAG ATG CAG GGC CAC AGA GGG AAC CCT ATA ATG AAT GGG CAC 
His Gin Lys Met Gin Gly His Arg Gly Asn Pro He Met Asn Gly His 
1195 1200 1205 



576 



TAG 



579 



(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 192 acides amines 

(B) TYPE: acide amin^ 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

Met Glu Asn Arg Trp Gin Val Met Val Val Trp Gin Val Asp Arg Met 
1 5 10 15 

Lys lie Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser 
20 25 30 

Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His 
35 40 45 

Pro Lys He Ser Ser Glu Val His He Pro Val Gly Gin Ala Arg Leu 
50 55 60 

Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gin Ser Trp His 
65 70 75 80 

Leu Gly His Gly Val Ser He Glu Trp Arg Leu Arg Lys Tyr Lys Thr 
85 90 95 

Gin Val Asp Pro Glu Met Ala Asp Lys Leu He His Leu His Tyr Phe 
100 105 110 

Asp Cys Phe Thr Ala Ser Ala He Arg Gin Ala Val Leu Gly Arg Pro 
115 120 125 

Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gin Val Gly Thr 
130 135 140 

Leu Gin Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys 
145 150 155 160 

Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu 
165 170 175 

His Gin Lys Met Gin Gly His Arg Gly Asn Pro He Met Asn Gly His 
180 185 190 



(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 288 paires de bases 

(B) TYPE: nucleotide 

. (C) NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (g^nomique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .285 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 

ATG GAA CGA GCA CCA GAA GAT GCA GGG CCA CAG AGG GAA CCC TAT AAT 
Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gin Arg Glu Pro Tyr Asn 
195 200 205 

GAA TGG GCA CTA GAA TTA TTA GAA GAA TTA AAA AAT GAA GCT GTG CGC 
Glu Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg 
210 215 220 
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CAT TTT CCA AGG ATT TGG CTA CAT GGG TTA GGA CAA CAC ATC TAT AAC 
His Phe Pro Arg He Trp Leu His Gly Leu Gly Gin His He Tyr Asn 
225 230 235 240 

ACA TAT GGA GAC ACC TGG GAG GGG GTA GAG GCA ATT ATC AGG ATA CTA 
Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala He He Arg He Leu 
245 250 255 

CAA CAA TTA CTG TTT ATC CAT TAT AGG ATT GGC TGC CAG CAC AGC AGA 
Gin Gin Leu Leu Phe He His Tyr Arg He Gly Cys Gin His Ser Arg 
260 265 270 

ATA GGG ATC ACT CCT CAA AGG AGA AGG AAT GGA ACC AGT AGA TCC 
He Gly He Thr Pro Gin Arg Arg Arg Asn Gly Thr Ser Arg Ser 
275 280 285 



TAG 



(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 95 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gin Arg Glu Pro Tyr Asn 
15 10 15 

Glu Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg 
20 25 30 

His Phe Pro Arg He Trp Leu His Gly Leu Gly Gin His He Tyr Asn 
35 40 45 

Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala He He Arg He Leu 
50 55 60 

Gin Gin Leu Leu Phe He His Tyr Arg He Gly Cys Gin His Ser Arg. 
65 70 75 80 

He Gly He Thr Pro Gin Arg Arg Arg Asn Gly Thr Ser. Arg Ser 
85 90 95 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 252 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: siznple 
ID) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (g^nomique) 



( ix ) CARACTERI STIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .249 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 

ATG CTG TCA TTG GGA TTC ATA GCG TTA GGA GCA GCA GTT AGC ATA OCA 
Met Leu Ser Leu Gly Phe lie Ala Leu Gly Ala Ala Val Ser lie Ala 
100 105 110 

GTA ATA GTC TGG GCA TTA CTA TAT AGA GAA TAT AAG AAA ATA AAA TTG 
Val lie Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys lie Lys Leu 
115 120 125 

CAG GAA AAA ATA AAA CAC ATA AGA CAG AGA ATA AGA GAA AGA GAA GAA 
Gin Glu Lys lie Lys His He Arg Gin Arg He Arg Glu Arg Glu Glu 
130 135 140 

GAT AGT GGC AAT GAA AGT GAT GGG GAT GCA GAG TGG TTG GAT GGG GAT 
Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp 
145 150 155 

GAA GAG TGG TTG GTT ACT CTT CTA TCT TCT AGT AAG CTT GAT CAA GGT 
Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gin Gly 
160 165 170 175 

AAT TGG GTC TGA 
Asn Trp Val 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 83 acides amines 

(B) TYPE: acide amind 

(D) CONFIGURATION: Unfair e 

(ii') TYPE DE MOLECULE: prot^ine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

Met Leu Ser Leu Gly Phe He Ala Leu Gly Ala Ala Val Ser He Ala 
1 5 10 15 

Val He Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys He Lys Leu 
20 25 . 30 

Gin Glu Lys He Lys His He Arg Gin Arg He Arg Glu Arg Glu Glu 
35 40 45 . 

Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp 
50 55 60 

Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gin Gly 
65 70 75 80 

Asn Trp Val 



(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 306 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .303 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 

ATG GAA CCA GTA GAT CCT AGA TTA GAG CCC TGG AAT CAT CCA GGA AGC 48 
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser 
85 90 95 

CAA CCT AAA ACA GCT TGC AAT AAT TGC TAT TGT AAA AGA TGT TGC TAT 96 
Gin Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr 
100 105 110 115 

CAC TGC TTA TAT TGC TTC ACA AAG AAA GGC TTA GGC ATC TCA TAT GGC 144 
His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly lie Ser Tyr Gly 
120 125 130 

AGG AAG AAG CGG AGT CAA CGA CGA AGA ACT CCT CAG AGC AGT AAG AGT 192 
Arg Lys Lys Arg Ser Gin Arg Arg Arg Thr Pro Gin Ser Ser Lys Ser 
135 140 145 

CAT CAA GAT CTT ATA CCA GAG CAG CCC TTA TCC CAA CAG CAA GGG GAC 240 
His Gin Asp Leu lie Pro Glu Gin Pro Leu Ser Gin Gin Gin Gly Asp 
150 155 160 

CAG ACA GGC CAG AAG AAA CAG PikG GAG GCG TTG GAG AGC AAG ACA GAG 288 
Gin Thr Gly Gin Lys Lys Gin Lys Glu Ala Leu Glu Ser Lys Thr Glu 
165 170 175 

GCA GAT CCG TGC GAT TAG 306 

Ala Asp Pro Cys Asp 

180 

(2) INFORMATIONS POOR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 101 acides amines 

(B) TYPE: acide amin^ 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser 
1 5 10 15 . 

Gin Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr 
20 25 30 

His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly lie Ser Tyr Gly 
35 40 45 

Arg Lys Lys Arg Ser Gin Arg Arg Arg Thr Pro Gin Ser Ser Lys Ser 
50 55 60 

His Gin Asp Leu lie Pro Glu Gin Pro Leu Ser Gin Gin Gin Gly Asp 
65 70 75 80 

Gin Thr Gly Gin Lys Lys Gin Lys Glu Ala Leu Glu Ser Lys Thr Glu 

85 90 95 . 

Ala Asp Pro Cys Asp 
100 
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(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 369 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (g6noinique) 

(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .366 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

ATG GCA GGA AGA AGC GGA GTC.AAC GAC GAA GAA CTC CTC AGA GCA GTA 48 
Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val 
105 110 115 

AGA GTC ATC AAG ATC TTA TAC CAG AGC AGT TAT CCC AAC AGC AAG GGG 96 
Arg Val lie Lys lie Leu Tyr Gin Ser Ser Tyr Pro Asn Ser Lys Gly 
120 125 130 

ACC AGA CAG GCC AGA AGA AAC AGA AGG AGG CGT TGG AGA GCA AGA CAG 144 
Thr Arg Gin Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gin 
135 140 145 

AGG CAG ATC CGT GCG ATT AGT GAG CGG ATT CTC AGC TCT TGT CTG GGA 192 
Arg Gin lie Arg Ala lie Ser Glu Arg lie Leu Ser Ser Cys Leu Gly 
150 155 160 165 

GGA CCT CCG GAA CCT GTT GAT CTT CCT CTA CCA CCG CTT GAC AGA CTC 240 
Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu 
170 175 180 

ACT CTT GAT ACT GAG GAG GAC TCT GGA ACT CCT GGG ACA GAG TCT CAG 288 
Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gin 
185 190 195 

CAG GGG ACT GCA ACT ACT GAA TGA ACT CAG AAC ACA CTT GTG GGG AAT 336 . 
Gin Gly Thr Ala Thr Thr Glu * Thr Gin Asn Thr Leu Val Gly Asn 
200 205 210 

ACT TGC ATA TTG GGG AAA AGA GTT AAG GGA TAG 369 
Thr Cys lie Leu Gly Lys Arg Val Lys Gly 
215 220 

(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 122 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: .proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 

Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val 
1 5 10 15 

Arg Val lie Lys lie Leu Tyr Gin Ser Ser Tyr Pro Asn Ser Lys Gly 
20 25 30 
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Thr Arg Gin Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gin 
35 40 45 

Arg Gin lie Arg Ala lie Ser Glu Arg lie Leu Ser Ser Cys Leu Gly 
50 55 60 

Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu 
65 70 75 80 

Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gin 
85 90 95 

Gin Gly Thr Ala Thr Thr Glu * Thr Gin Asn Thr Leu Val Gly Asn 
100 105 110 

Thr Cys lie Leu Gly Lys Arg Val Lys Gly 
115 120 

(2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES- DE LA SEQUENCE: 

(A) LONGUEUR: 2559 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (g^nomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .2556 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

ATG AAA GTG ATG GGG ATG CAG AGT GGT TGG ATG GGG ATG AAG AGT GGT 48 
Met Lys Val Met Gly Met Gin Ser Gly Trp Met Gly Met Lys Ser Gly 
125 130 135 

TGG TTA CTC TTC TAT CTT CTA GTA AGC TTG ATC AAG GTA ATT GGG TCT 96 
Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu lie Lys Val lie Gly Ser 
140 145 15*0 

GAA CAA CAT TGG GTA AC A GTG TAC TAT GGG GTA CCA GTA TGG AGA GAA 144 
Glu Gin His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu 
155 160 165 170 

GCA GAG ACA ACT CTT TTC TGT GCT TCA GAT GCT AAA GCC CAT AGT ACA 192 
Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr 
175 180 185 

GAG GCT CAC AAC ATC TGG GCC ACA CAA GCA TGT GTT CCT ACT GAT CCC 240 
Glu Ala His Asn lie Trp Ala Thr Gin Ala Cys Val Pro Thr Asp Pro 
190 195 200 

AAT CCA CAA GAA GTG CTA TTA CCC AAT GTA ACT GAA AAA TTT AAT ATG 288 
Asn Pro Gin Glu Val Leu Leu Pro Asn Val Thr Glu Lys Phe Asn Met 
205 210 215 



TGG GAA AAT AAA ATG GCA GAC CAA ATG CAA GAG GAT ATT ATC AGT CTG 336 
Trp Glu Asn Lys Met Ala Asp Gin Met Gin Glu Asp lie lie Ser Leu 
220 225 230 
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TGG GAA CAG -AGC TTA AAG CCC TGT GTT AAA TTA ACC CCA TTA TOT GTA 384 
Trp Glu Gin Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val 
235 240 245 250 

ACT ATG CTT TGT AAC GAT AGC TAT GGG GAG GAA AGG AAC AAT ACA AAT 432 
Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn 
255 260 265 

ATG ACA ACA AGA GAA CCA GAC ATA GGA TAC AAA CAA ATG AAA AAT TGC 480 
Met Thr Thr Arg Glu Pro Asp lie Gly Tyr Lys Gin Met Lys Asn Cys 
270 275 280 

TCA TTC AAT GCA ACC ACT GAG CTA ACA GAT AAA AAG AAG CAA GTT TAC 528 
Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gin Val Tyr 
285 290 295 

TCT CTG TTT TAT GTA GAA GAT GTA GTA CCA ATC AAT GCC TAT AAT AAA 576 
Ser Leu Phe Tyr Val Glu Asp Val Val Pro lie Asn Ala Tyr Asn Lys 
300 305 310 

ACA TAT AGG CTA ATA AAT TGT AAT ACC ACA GCT GTG ACA CAA GCT TGT 624 
Thr Tyr Arg Leu lie Asn Cys Asn Thr Thr Ala Val Thr Gin Ala Cys 
315 320 325 330 

CCT AAG ACT TCC TTT GAG CCA ATT CCA ATA CAT TAC TGT GCA CCA CCA 672 
Pro Lys Thr Ser Phe Glu Pro He Pro He His Tyr Cys Ala Pro Pro 
335 340 345 

GGC TTT GCC ATT ATG AAA TGT AAT GAA GGA AAC TTT AGT GGA AAT GGA 720 
Gly Phe Ala He Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly 
350 355 360 

AGC TGT ACA AAT GTG AGT ACT GTA CAA TGC ACA CAT GGA ATA AAG CCA 768 
Ser Cys Thr Asn Val Ser Thr Val Gin Cys Thr His Gly He Lys Pro 
365 370 375 

GTG ATA TCC ACT CAG TTA ATC CTA AAT GGA AGC TTA AAT ACA GAT GGA 816 
Val He Ser Thr Gin Leu He Leu Asn Gly Ser Leu Asn Thr Asp Gly 
380 385 390 

ATT GTT ATT AGA AAT GAT AGT CAC AGT AAT CTG TTG GTG CAA TGG AAT 854 
He Val He Arg Asn Asp Ser His Ser Asn Leu Leu Val Gin Trp Asn 
395 400 405 410 

GAG ACA GTG CCA ATA AAT TGT ACA AGG CCA GGA AAT AAT ACA GGA GGA 912 
Glu Thr Val Pro He Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly 
415 420 425 

CAG GTG CAG ATA GGA CCT GCT ATG ACA TTT TAT AAC ATA GAA AAA ATA 960 
Gin Val Gin He Gly Pro Ala Met Thr Phe Tyr Asn He Glu Lys He 
430 435 440 

GTA GGA GAC ATT AGA CAA GCA TAC TGT AAT GTC TCT AAA GAA CTA TGG 1008 
Val Gly Asp He Arg Gin Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp 
445 450 455 

GAA CCA ATG TGG AAT AGA ACA AGA GAG GAA ATA AAG AAA ATC CTG GGG 1056 
Glu Pro Met Trp Asn Arg Thr Arg Glu Glu He Lys Lys He Leu Gly 
460 465 470 

AAA AAC AAC ATA ACC TTC AGG GCT CGA GAG AGG AAT GAA GGA GAC CTA H04 
Lys Asn Asn He Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu 
475 480 485 490 
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GAA GTG ACA CAC TTA ATG TTC AAT TGT AGA GGA GAG TTT TTC TAT TGT 1152 

Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 
495 500 505 

AAC ACT TCC AAA TTA TTT AAT GAG GAA TTA CTT AAC GAG ACA GGT GAG 1200 
Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu 
510 515 520 

CCT ATT ACT CTG CCT TGT AGA ATA AGA CAG ATT GTA AAT TTG TGG ACA 1248 
Pro lie Thr Leu Pro Cys Arg lie Arg Gin lie Val Asn Leu Trp Thr 
525 530 535 

AGG GTA GGA AAA GGA ATT TAT GCA CCA CCA ATT CGG GGA GTT CTT AAC 1296 
Arg Val Gly Lys Gly He Tyr Ala Pro Pro lie Arg Gly Val Leu Asn 
540 545 550 

TGT ACC TCC AAT ATT ACT GGA CTG GTT CTA GAA TAT AGT GGT GGG CCT 1344 
Cys Thr Ser Asn He Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro 
555 560 565 570 

GAC ACC AAG GAA ACA ATA GTA TAT CCC TCA GGA GGA AAC ATG GTT AAT 1392 
Asp Thr Lys Glu Thr He Val Tyr Pro Ser Gly Gly Asn Met Val Asn 
575 580 585 

CTC TGG AGA CAA GAG TTG TAT AAG TAC AAA GTA GTT AGC ATA GAA CCC 1440 
Leu Trp Arg Gin Glu Leu Tyr Lys Tyr Lys Val Val Ser He Glu Pro 
590 595 600 

ATA GGA GTA GCA' CCA GGT AAA GCT AAA AGA CGC ACA GTG AGT AGA GAA 1488 
He Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu 
605 610 615 

AAA AGA GCA GCC TTT GGA CTA GGT GCG CTG TTT CTT GGG TTT CTT GGA 153 6 
Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly 
620 625 630 

GCA GCA GGG AGC ACT ATG GGC GCA GCG TCA ATA ACG CTG ACG GTA CAG 1584 
Ala Ala Gly Ser Thr Met Gly Ala Ala Ser He Thr Leu Thr Val Gin 
635 640 645 650 

GCC CGG ACA TTA TTA TCT GGG ATA GTG CAA CAG CAG AAT ATT CTG TTG 1632 
Ala Arg Thr Leu Leu Ser Gly He Val Gin Gin Gin Asn He Leu Leu 
655 660 665 

AGA GCA ATA GAG GCG CAA CAA CAT TTG TTG CAA CTC TCA ATC TGG GGC 1680 
Arg Ala He Glu Ala Gin Gin His Leu Leu Gin Leu Ser He Trp Gly 
670 675 680 

ATT AAA CAG CTC CAG GCA AAA GTC CTT GCT ATA GAA AGA TAC CTT AGG 1728 
He Lys Gin Leu Gin Ala Lys Val Leu Ala He Glu Arg Tyr Leu Arg 
685 690 695 

GAT CAG CAA ATC CTA AGT CTA TGG GGC TGC TCA GGA AAA ACA ATA TGC 1776 
Asp Gin Gin He Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr He Cys 
700 705 710 

TAT ACC ACT GTG CCT TGG AAT GAG ACT TGG AGC AAC AAT ACC TCT TAT 1824 
Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr 
715 720 725 730 

GAT ACA ATC TGG AAT AAT TTA ACC TGG CAA CAA TGG GAT GAG AAA GTA 1872 
Asp Thr He Trp Asn Asn Leu Thr Trp Gin Gin Trp Asp Glu Lys Val 
735 740 745 
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AGA AAC TAT TCA GGT GTC ATT TTT GGA CTT ATA GAA CAG GCA CAA GAA 1920 
Arg Asn Tyr Ser Gly Val lie Phe Gly Leu lie Glu Gin Ala Gin Glu 
750 755 760 

CAA CAG AAC ACA AAT GAG AAA TCA CTC TTG GAA TTG GAT CAA TGG GAC 1968 
Gin Gin Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gin Trp Asp 
765 770 775 

AGT CTG TGG AGC TGG TTT GGT ATT ACA AAA TGG CTG TGG TAT ATA AAA 2016 
Ser Leu Trp Ser Trp Phe Gly lie Thr Lys Trp Leu Trp Tyr lie Lys 
780 785 790 



ATA GCT ATA ATG ATA GTA GCA GGC ATT GTA GGC ATA AGA ATC ATA AGT . 2064 
lie Ala lie Met He Val Ala Gly He Val Gly He Arg He He Ser 
795 800 805 810 

ATA GTA ATA ACT ATA ATA GCA AGA GTT AGG CAG GGA TAT TCT CCC CTT 2112 
He Val He Thr He He Ala Arg Val Arg Gin Gly Tyr Ser Pro Leu 
815 820 825 

TCG TTG CAG ACC CTT ATC CCA ACA GCA AGG GGA CCA GAC AGG CCA GAA 2160 
Ser Leu Gin Thr Leu He Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu 
830 835 840 

GAA ACA GAA GGA GGC GTT GGA GAG CAA GAC AGA GGC AGA TCC GTG CGA 2208 
Glu Thr Glu Gly Gly Val Gly Glu Gin Asp Arg Gly Arg Ser Val Arg 
845 850 855 

TTA GTG AGC GGA TTC TCA GCT CTT GTC TGG GAG GAC CTC CGG AAC CTG 2256 
Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu 
860 865 870 

TTG ATC TTC CTC TAC CAC CGC TTG ACA GAC TCA CTC TTG ATA CTG AGG 2304 
Leu He Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu He Leu Arg 
875 880 885 890 

AGG ACT CTG GAA CTC CTG GGA CAG AGT CTC AGC AGG GGA CTG CAA CTA 2352 
Arg Thr Leu Glu Leu Leu Gly Gin Ser Leu Ser Arg Gly Leu Gin Leu 
895 900 905 

CTG AAT GAA CTC AGA ACA CAC TTG TGG GGA ATA CTT GCA TAT TGG GGA 2400 
Leu Asn Glu Leu Arg Thr His Leu Trp Gly He Leu Ala Tyr Trp Gly 
910 915 920 

AAA GAG TTA AGG GAT AGT GCT ATC AGC TTG CTT AAT ACA ACA GCT ATT 2448 
Lys Glu Leu Arg Asp Ser Ala He Ser Leu Leu Asn Thr Thr Ala He 
925 930 935 



GTA GTA GCA GAA GGA ACA GAT AGG ATT ATA GAA TTA GCA CAA AGA ATA 2496 
Val Val Ala Glu Gly Thr Asp Arg He He Glu Leu Ala Gin Arg He 
940 945 950 

GGA AGG GGA ATA TTA CAC ATA CCT AGA AGA ATC AGA CAA GGC CTA GAA 2544 
Gly Arg Gly He Leu His He Pro Arg Arg He Arg Gin Gly Leu Glu 
955 960 965 970 



AGA GCA CTG ATA TAA 
Arg Ala Leu He 



2559 
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(2) INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 852 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 

Met Lys Val Met Gly Met Gin Ser Gly Trp Met Gly Met Lys Ser Gly 
15 10 15 

Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu lie Lys Val lie Gly Ser 
20 25 30 

Glu Gin His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu 
35 40 45 

Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr 
50 55 60 

Glu Ala His Asn lie Trp Ala Thr Gin Ala Cys Val Pro Thr Asp Pro 
65 70 75 80 

Asn Pro Gin Glu Val Leu Leu Pro Asn Val Thr Glu Lys Phe Asn Met 
85 90 95 

Trp Glu Asn Lys Met Ala Asp Gin Met Gin Glu Asp lie lie Ser Leu 
100 105 110 

Trp Glu Gin Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val 
115 120 125 

Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn 
130 135 140 

Met Thr Thr Arg Glu Pro Asp lie Gly Tyr Lys Gin Met Lys Asn Cys 
145 150 155 160 

Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gin Val Tyr 
165 170 175 

Ser Leu Phe Tyr Val Glu Asp Val Val Pro lie Asn Ala Tyr Asn Lys 
180 185 190 

Thr Tyr Arg Leu lie Asn Cys Asn Thr Thr Ala Val Thr Gin Ala Cys 
195 200 205 

Pro Lys Thr Ser Phe Glu Pro lie Pro lie His Tyr Cys Ala Pro Pro 
210 215 220 

Gly Phe Ala lie Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly 
225 230 235 240 

Ser Cys Thr Asn Val Ser Thr Val Gin Cys Thr His Gly lie Lys Pro 
245 250 255 

Val lie Ser Thr Gin Leu lie Leu Asn Gly Ser Leu Asn Thr Asp Gly 
260 265 270 

lie Val lie Arg Asn Asp Ser His Ser Asn Leu Leu Val Gin Trp Asn 
275 280 285 

Glu Thr Val Pro lie Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly 
290 295 300 
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Gin Val Gin He Gly Pro Ala Met Thr Phe Tyr Asn He Glu Lys He 

305 310 315 320 

Val Gly Asp He Arg Gin Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp 
325 330 335 

Glu Pro Met Trp Asn Arg Thr Arg Glu Glu He Lys Lys He Leu Gly 
340 345 350 

Lys Asn Asn He Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu 
355 360 365 

Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 
370 375 380 

Asn Thr Ser Lys Leu Phe Ash Glu Glu Leu Leu Asn Glu Thr Gly Glu 
385 390 395 400 

Pro He Thr Leu Pro Cys Arg He Arg Gin He Val Asn Leu Trp Thr 
405 410 415 

Arg Val Gly Lys Gly He Tyr Ala Pro Pro He Arg Gly Val Leu Asn 
420 425 430 

Cys Thr Ser Asn He Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro 
435 440 445 

Asp Thr Lys Glu Thr He Val Tyr Pro Ser Gly Gly Asn Met Val Asn 
450 455 460 

Leu Trp Arg Gin Glu Leu Tyr Lys Tyr Lys Val Val Ser He Glu Pro 
465 470 475 480 

He Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu 



Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly 
500 505 510 

Ala Ala Gly Ser Thr Met Gly Ala Ala Ser He Thr Leu Thr Val Gin 
515 520 525 

Ala Arg Thr Leu Leu Ser Gly He Val Gin Gin Gin Asn He Leu Leu 
530 535 540 

Arg Ala He Glu Ala Gin Gin His Leu Leu Gin Leu Ser He Trp Gly 
545 550 555 560 

He Lys Gin Leu Gin Ala Lys Val Leu Ala He Glu Arg Tyr Leu Arg 
565 570 575 

Asp Gin Gin He Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr He Cys 
580 585 590 

Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr 
595 600 605 

Asp Thr He Trp Asn Asn Leu Thr Trp Gin Gin Trp Asp Glu Lys Val 
610 615 620 

Arg Asn Tyr Ser Gly Val He Phe Gly Leu He Glu Gin Ala Gin Glu 
625 630 635 640 

Gin Gin Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gin Trp Asp 



485 



490 



495 



645 



650 



655 
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Ser Leu Trp Ser Trp Phe Gly lie Thr Lys Trp Leu Trp Tyr lie Lys 
660 665 670 

lie Ala lie Met lie Val Ala Gly He Val Gly He Arg He He Ser 
675 680 685 

He Val He Thr He He Ala Arg Val Arg Gin Gly Tyr Ser Pro Leu 
690 695 700 

Ser Leu Gin Thr Leu He Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu 
705 710 715 720 

Glu Thr Glu Gly Gly Val Gly Glu Gin Asp Arg Gly Arg Ser Val Arg 
725 730 735 

Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu 
740 745 750 

Leu He Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu He Leu Arg 
755 760 765 

Arg Thr Leu Glu Leu Leu Gly Gin Ser Leu Ser Arg Gly Leu Gin Leu 
770 775 780 

Leu Asn Glu Leu Arg Thr His Leu Trp Gly He Leu Ala Tyr Trp Gly 
785 790 795 800 

Lys Glu Leu Arg Asp Ser Ala He Ser Leu Leu Asn Thr Thr Ala He 
805 810 815 

Val Val Ala Glu Gly Thr Asp Arg He He Glu Leu Ala Gin Arg He 
820 825 830 

Gly Arg Gly He Leu His He Pro Arg Arg He Arg Gin Gly Leu Glu 
835 840 845 

Arg Ala Leu He 
850 

(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 639 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: . ADN (genomique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT :1. .636 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

ATG GGA AAG ATT TGG TCA AAG AGC AGC CTA GTA GGA TGG CCA GAA ATC 48 
Met Gly Lys He Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu He 
855 860 865 

AGA GAA AGA ATG AGA AGA CAA ACG CAA GAA CCA GCA GTA GAG CCA GCA 96 
Arg Glu Arg Met Arg Arg Gin Thr Gin Glu Pro Ala Val Glu Pro Ala 
870 875 880 
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GTA GGA GCA GGA GCA GCT TCT CAA GAT CTA GCT AAT CGA GGG GCC ATC 144 
Val Gly Ala Gly Ala Ala Ser Gin Asp Leu Ala Asn Arg Gly Ala lie 
885 890 895 900 

ACC ATA AGA AAT ACT AGA GAC AAT AAT GAA AGT ATA GCT TGG CTA GAA 192 
Thr lie Arg Asn Thr Arg Asp Asn Asn Glu Ser lie Ala Trp Leu Glu 
905 910 915 

GCA CAA GAA GAA GAA GAG GAA GTA GGC TTT CCA GTA CGC CCT CAG GTA 240 
Ala Gin Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gin Val 
920 925 930 

CCA TTA AGG CCA ATA ACC TAT AAA CAG GCT TTT GAT CTT TCC TTC TTT 288 
Pro Leu Arg Pro lie Thr Tyr Lys Gin Ala Phe Asp Leu Ser Phe Phe 
935 940 945 

TTA AAA GAT AAG GGG GGA CTG GAA GGG CTA GTT TGG TCC AGA AAA AGG 336 
Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg 
950 955 960 

CAA GAT ATT CTA GAC CTC TGG ATG TAT CAC ACA CAA GGC ATC CTC CCT 384 
Gin Asp lie Leu Asp Leu Trp Met Tyr His Thr Gin Gly lie Leu Pro 

965 970 975 . 980 

GAC TGG CAT AAC TAC ACA CCA GGG CCA GGA ATT AGA TAG CCC GTA ACC 432 
Asp Trp His Asn Tyr Thr Pro Gly Pro Gly lie Arg Tyr Pro Val Thr 
985 990 995 

TTT GGA TGG TGC TTC AAA CTA GTA CCA TTG TCA GCT GAA GAA GTA GAA 480 
Phe Gly Tru Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu 
1000 1005 1010 

GAG GCT AAT GAA GGA GAC AAC AAT GCC CTC TTA CAC CCC ATA TGT CAA 528 
Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro lie Cys Gin 
1015 1020 1025 

CAT GGA GCA GAT GAT GAT CAT AAA GAA GTG TTG GTG TGG CGA TTT GAC 576 
His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp 
1030 1035 1040 

AGC TCC CTA GCA AGA AGA CAT GTA GCA AGA GAG CTG CAT CCG GAG TTT 624 
Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe 
1045 1050 1055 1060 

TAC AAG AAC TGC TGA 639 
Tyr Lys Asn Cys 



(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 212 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 

Met Gly Lys He Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu He 
1 5 10 15 



Arg Glu Arg Met Arg Arg Gin Thr Gin Glu Pro Ala Val Glu Pro Ala 
20 25 30 
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Val Gly Ala Gly 
35 

Thr lie Arg Asn 
50 

Ala Gin Glu Glu 
65 

Pro Leu Arg Pro 



Leu Lys Asp Lys 
100 

Gin Asp lie Leu 
115 

Asp Trp His Asn 
130 

Phe Gly Trp Cys 
145 

Glu Ala Asn Glu 



His Gly Ala Asp 
180 

Ser Ser Leu Ala 
195 

Tyr Lys Asn Cys 
210 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
ATTGCGTACT CACACTTCCG 20 
(2) INFORMATIONS POUR LA SEQ ID NO: 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl6ique 
(A) DESCRIPTION: /desc = "AMORCE" 



Ala Ala Ser Gin Asp Leu Ala Asn Arg Gly Ala lie 
40 45 

Thr Arg Asp Asn Asn Glu Ser lie Ala Trp Leu Glu 
55 60 

Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gin Val 
70 75 80 

He Thr Tyr Lys Gin Ala Phe Asp Leu Ser Phe Phe 
85 90 95 

Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg 

105 110 

Asp Leu Trp Met Tyr His Thr Gin Gly He Leu Pro 
120 125 

Tyr Thr Pro Gly Pro Gly He Arg Tyr Pro Val Thr 
135 140 

Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu 
150 155 160 

Gly Asp Asn Asn Ala Leu Leu His Pro He Cys Gin 
165 170 175 

Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp 
185 190 



Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe 
200 205 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 
GGCAAGCAGG GAGCTGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 23; 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE* 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 
TCCTTGAGCA GTCTGGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 

GAACAGGAGG ATTAGCAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 
AGCAGAGGCT ATGTCACA 

(2) INFORMATIONS POUR LA SEQ ID NO: 26: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 
TGTAAGGCCC CTAGAAGAG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl6ique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27 
ACAGAGAACT CTCTGTAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
ID) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28 
AAGAAAAGCA GTTGGTAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29 
TTTCTTCCCT GTATGTC 

(2) INFORMATIONS POUR LA SEQ ID NO: 30: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30 

GTTATATGGA TTCTCAGG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31 

TGGCAGCACA TTATACTGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 32: 

(i) CARACTEPlISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32 
ATCATTTACC AGTACATGGA CGA 
(2) INFORMATIONS POUR LA SEQ ID NO: 33: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33 

TGTCAGGGGT CGTAAAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34 
TCCTCTGGAT GGGATATG 

(2) INFORMATIONS POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 18 paires de bases 
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(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35 
TCTATCCAGG AATCAGAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 36: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36 
AATGAGATCT GCCCATAC 

(2) . INFORMATIONS POUR LA SEQ ID NO: 37: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37 
TGACAGATAG GGGAAGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 38: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 38 

AACCGCCATT TGCACTGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 39: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 
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(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 39 
ACATGGACCG CCACAAGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 40: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 40 

AGCAACAGAC ATACAGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 41: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: siinple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 41 

AAAGTAGTCC CACGTAGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 42: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 42 
ATATCCCAGT AGGTCAGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 43: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = « AMORCE" 
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(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 43 
TCTAGCACTA ACAGCCTG 

(2) INFORMATIONS POUR LA SEQ ID NO: 44: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucl6igue 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 44 
ACTCTTACTG CTCTGAGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 45: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucleigue 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 45 
CCATAGTACA CTGTTACC 

(2) INFORMATIONS POUR LA SEQ ID NO: 46: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

' (ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 46 
CATAGCTATC GTTACAAAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 47: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl6ique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 47 
TCATAATGGC AAAGCCTG 

(2) INFORMATIONS POUR LA SEQ ID NO: 48: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 48 
CTATTCCACA TTGGTTCC 

(2) INFORMATIONS POUR LA SEQ ID NO: 49: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 49 
ATTCTAGAAC CAGTCCAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 50: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 50 
CCTTAGGGAT CAGCAAATCC 

(2) INFORMATIONS POUR LA SEQ ID NO: 51: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 51 
TGGGACAGTC TGTGGAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 52: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 52 

TTCTCAGCTC TTGTCTGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 53: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 53 

ATTAAGCAAG CTGATAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 54: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: single 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 54 

TGTGCTTCTA GCCAAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 55: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 55 

GCTCCATGTT GACATATG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 56: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE- 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 56: 

AGAGAGACCC AGTACAAG 18 

(2) INFORMATIONS POUR LA SEQ ID NO: 57: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
(A) DESCRIPTION: /desc = "AMORCE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 57: 

ATAAAAGCAG CCGCTTCTCG 20 

(2) INFORMATIONS POUR LA SEQ ID NO: 58: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 acides amines 

(B) TYPE: acide amin^ 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 58: 

Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly Gin Val Gin lie Gly Pro 
1 5 10 15 

Ala Met Thr Phe Tyr Asn lie Glu Lys lie Val Gly Asp lie Arg Gin 
20 25 30 

Ala Tyr Cys 
35 

(2) INFORMATIONS POUR LA SEQ ID NO: 59: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 59: 

Cys His Arg Pro Gly Asn Asn Thr Arg Gly Glu Val Gin lie Gly Pro 
15 10 15 
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Gly Met Thr Phe Tyr Asn lie Glu Asn Val Tyr Gly Asp Thr Arg Ser 
20 25 30 

Ala Tyr Cys 
35 

(2) INFORMATIONS POUR LA SEQ ID NO: 60: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 35 acides amines 

(B) TYPE: acide amin6 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 60: 

Cys lie Arg Pro Gly Asn Arg Thr Tyr Arg Asn Leu Gin lie Gly Pro 
15 10 15 

Gly Met Thr Phe Tyr Asn Val Glu lie Ala Thr Gly Asp lie Arg Lys 
20 25 30 

Ala Phe Cys 
35 

(2) INFORMATIONS POUR LA SEQ ID NO: 61: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 35 acides amines 
{B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ 

Cys Thr Arg Pro Asn Asn Asn Thr Arg 
1 5 

Gly Gin Ala Phe Tyr Ala Thr Gly Asp 
20 25 

Ala His Cys 
35 



ID NO: 61: 

Lys Ser Val Arg lie Gly Pro 
10 15 

lie lie Gly Asp lie Arg Gin 
30 
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REVENDICATIQNS 
1°) Souche de VM-l non-M non-0, presentant les caracteristiques 
morphologiques et immunologiques du retrovirus deposes a la Collection Nationale de 
Cultures de Microorganismes tenue par Tlnstitut Pasteur sous le numero 1-1753 
5 (denomme YBF30) le 2 juillet 1996. 

2*^) Sequences d'acide nucleique, caracterisees en ce qu'elles sont 
issues de la souche selon la revendication 1. 

3"") Sequence d'acide nucleique selon la revendication 2, caracterisee 
en ce qu*elle est selectionnee dans le groupe constitue par les sequences suivantes : la 
10 sequence nucleotidique complete de la souche selon la revendication 1 (SEQ ED N°l) 
ainsi que des fragments d'acide nucleique, issus de ladite souche : (SEQ ID N®2), 
(SEQ ID N^3), (SEQ ID N°5), (SEQ ED N°7), (SEQ ID N^9), (SEQ ED N^l 1), (SEQ 
ID N°13), (SEQ ED N^IS), (SEQ ID N^17), (SEQ ID N°19) et les SEQ ID N^21-57, 
ainsi que toute sequence, qui n*est pas identique a Tune des sequences nucleotidiques 
15 ci-dessus ou n'est pas complementmre de Tune de ces sequences, mais est neanmoins 
susceptible de s'hybrider avec une sequence nucleique issue d*un virus VIH-1 non-M, 
non-O. 

4°) Oligonucleotide, caracterise en ce qu'il est selectionne parmi les 
sequences SEQ ED N'^21 a 57 et en ce qu'il est apte a servir d'amorce et/ou de sonde 
20 pour la detection d'un VIH-1 selon la revendication 1 ou la revendication 5. 

5**) VIH-1, caracterises en ce qu'ils sont distincts a la fois du groupe 
M et du groupe O et pfesentent les caracteristiques suivantes : 

* peu ou pas de reactivite serologique vis-a-vis des proteines des 
groupes M et O et forte reactivity serologique vis-a-vis des proteines issues de la 

25 souche YBF30 selon la revendication 1 ou de la souche SIV CPZGAB ; 

* absence d' amplification genomique a I'aide des amorces des 
regions env et gag des VIH-1 des groupes M et 0 ; 

* amplification genomique en presence des amorces issues de la 
souche YBF30, selon la revendication 4 ; et 

30 * homologie des produits du gene d'enveloppe superieure a 70 % 

vis-a-vis de la souche YBF30. 
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6°) Precede de diagnostic in vitro d'un VIH-1 de groupe non-M non- 
O, par hybridation et/ou amplification genique, realise a partir d'un echantillon biolo- 
gique (serum ou lymphocyte circulant), lequel precede est caracterise en ce qu'il 
comprend : 

5 . une etape d'eTctraction de Tacide nucleique a detecter, appartenant 

au genome du virus, eventuellement present dans Techantillon biologique et, le cas 
echeant, une etape de traitement de Tacide nucleique, a I'aide d'une transcriptase inver- 
se, si ce dernier est sous forme d' ARN, 

. au moins un cycle comprenant les etapes de denaturation de Tacide 

10 nucleique, d' hybridation avec au moins une sequence selon la revendication 3 ou la 
revendication 4 et eventuellement, si necessaire, extension de I'hybride forme, en 
presence de reactifs convenables (agent de polymerisation, tel qu'ADN polymerase et 
dNTP)et 

. une etape de detection de la presence eventuelle de Tacide 

15 nucleique appartenant au genome d'un virus de type VIH-1 de groupe non-M non-0. 

T") Peptide, caracterise en ce qu'il est susceptible d'etre exprime par 
une souche de VIH-1 non-M non-0 selon la revendication 1 ou la revendication 5 ou a 
I'aide d'une sequence nucleotidique selon la revendication 3 et en ce qu'il est apte (1) a 
etre reconnu par des anticorps induits par un VIH-1 non-M non-0 selon la revendica- 

20 tion 1 ou la revendication S ou un variant de celui-ci et presents dans un echantillon 
biologique obtenu apres une infection par une souche de VIH-1 non-M non-0 et/ou (2) 
a induire la production d'anticorps anti- VIH-1 non-M non-0. 

8*^) Peptide selon la revendication 7, caracterise en ce qu'il est choisi 
parmi celui exprime par le gene gag (SEQ ID 4), celui exprime par le gene pol 

25 (SEQ ID W 6), celui exprime par le gene v//(SEQ ID N"" 8), celui exprime par le gene 
vpr (SEQ ID N"* 10), celui exprime par le gene ypu (SEQ ID 12), celui exprime par 
le gene tat (SEQ ID N"" 14), celui exprime par le gene rev (SEQ ID N° 16), celui 
exprime par le gene env (SEQ ID N*" 18) ou I'un de ses fragments, tels qu'un fragment 
de la region de la boucle V3 (SEQ ID 58) et celui exprime par le gene we/ (SEQ ID 

30 N° 20) ou un fragment de ceux-ci aptes a reconnaitre les anticorps produits lors d'une 
infection par un VIH-1 selon la revendication 1 ou la revendication 5. 
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9°) Compositions immunogenes comprenant un ou plusieurs produits 
de traduction des sequences nucleotidiques selon la revendication 3 et/ou Tun des pep- 
tides selon la revendication 7 ou la revendication 8. 

10®) Anticorps diriges contre Tun ou plusieurs des peptides selon la 
5 revendication 7 ou la revendication 8. 

ir) Methode de diagnostic in vitro d'un VIH-1 non-M non-0, 
caracterisee en ce qu'elle comprend la mise en contact d'un echantillon biologique 
preleve chez un patient, avec des anticorps selon la revendication 10, eventuellement 
associes a des anticorps anti-SIV CPZGAB et la detection des complexes immuno- 
10 logiques formes entre les antigenes de VIH-1, eventuellement presents dans 
r echantillon biologique et lesdits anticorps. 

12®) Reactif de diagnostic d'un VTH-l non-M non-0, caracterise en 
ce qu'il comprend une sequence selon Tune quelconque des revendications 3, 4, 7 ou 
8. 

15 13®) Procede de criblage et de typage d'un VIH-1 non-M non-0, 

caracterise en ce qu'il comprend la mise en contact de I'un quelconque des fragments 
nucleotidiques selon la revendication 3 ou la revendication 4 avec I'acide nucleique du 
virus a typer et la detection de Thybride forme. 

14®) Trousse de diagnostic de VIH-1 non-M non-0, caracterisee en 

20 ce qu'elle inclut au moins un reactif selon la revendication 12. 
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YLG Itr ATTGCGTACTCACACTTCCG 

LPBS.1 Itr GGCAAGCAQGGAGCTGG 

GAGY Itr TCCTTGAGCAGTCTGGAC 
AS1.1 

GAGY flrapGAACAGGAGGAT TAGCAG 
AS1 

Gag 6 yapAGCAGAGGCTATGTCACA 

GAGYS1 gapTGTAAGGCCCCTAGAAGAG 

GAGY gapACAGAGAACT CT CT GT AC 
S1.1 

GAG Y gagAAGAAAAGCAGTTGGTA.C 
SI .2 

YRTAS po/ TTTCTTCCCTGTATGTC 
1.3 

YRTAS1.2 pol GTTATATGGATTCTCAGG 

YRTAS1.1 pol TGGCAGCACA TT AT ACT G G 

YRT2 pol ATCATTTACCAGTACATGGAGGA 

YRTAS1 pol TGTCAGGGGT CGTAAAGC 

YRT2-1 pal TCCTCTGGAT GGGATATG 

YRT2-2 pol TCTATCCAGGAATCAGAG 

YRT-3 pol A.ATGAGA T CT GC CCAT A C 

YRT2-4 pol TGACAGATAGGGGAAGAC 

448M pol AACCGCCATT TGCACT GC 

4481-2 po/ACATGGACCGCCACAAGG 

4235.1 pol AGCAACAGACAT ACAGAC 

4235.2 vif AAAGTAGTCCCACGTAGG 

4235.3 tefATATCCCAGTAGGTCA GG 

4235.4 tat TCTAGCACTAACAGCCTG 
SK69.6 eni^ACTCTTACTGCTC.TGAGG 
SK69.5 envCCATAGT ACA CT GTTA CC 
SK69.4 envCATAGCT ATC GT T A CA A A GC 
SK69.3 envTCATAAT GGC AA AGCCT G 
SK69.2 eni^CTATTCCACA TT GGTT CC 
SK69.1 ewATTCTAGAAC CA GT CCA G 

SK68.1 envCCTTAGGGAT CAGCAAAT CC. 

SK68.2 envTGQGACA GTC T GT GGA GC 

SK68.3 env^TTCTCAGCTCTT GTCT GG 

LSIAS1.3 ne/ATTAAGCAAGCTGATAGC 

LSIAS1.2 neATGTGCTTCTAGCCAAG 

LSI AS 1.1 Itr GCTCCATGTTGACATATG 

LSiA1 Itr AGAGAGACCCAGTACAAG 

YLPA Itr ATAAAAGCAGCCGCTTCTCG 
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